дык есть методики же. даже есть адекватные эксперименты из области психологии, не то что из области программирования.
нужно только захотеть. и потихоньку ужесточать критерии уровня докладов на конференциях
Тут есть большой вопрос о применимости методик к промышленной деятельности. Грубо говоря, когда пишется софт для достижения каких-то коммерческих целей, то никто не сможет позволить себе удвоить (или утроить) расходы на его реализацию создав две команды и применив разные методики/подходы к разработке.
Это даже на более мелких масштабах хорошо видно. Тяжело найти нормальное сравнение двух языков программирования, которое бы показывало различие на более-менее большой кодовой базе. В основном берутся либо совсем микропримеры, либо небольшие программы, размером не более 1KLOC.
Или еще более мелкий масштаб: стоимость исключений в C++ в сравнении с кодами ошибок. Если задасться целью найти большое сравнение, которое бы проводило эксперимент на реально объемной кодовой базе, то будет трудно.
Что уж про методику разработки говорить.
Поэтому тут, как я понимаю, другие подходы используют: анализируют рассказы о том, что применялось, а потом делают выводы. Мол, если применяется вот эта шняга, то вероятность успеха снижается. А если вот эта, то повышается. И в результате методы разработки проходят через эволюционный отбор. Разбавляемый временами разными модными вбросами.