Привет! Постараюсь кратко - пришел на проект, продукт, большая легаси кодовая база. Сперва выделили время на стабилизацию - исправили и приоритезировали частые проблемы и ошибки, но осталась проблема с фантомными багами и с ростом количетсва пользователей их становится все больше и больше, создается впечатление, что продукт "разваливается". Начали собирать статистику по количеству таких, группировать в контексты, логировать время затраченное на поддержку и влияние на customer success - очень много багов которые раньше не появлялись или появлялись только один раз, трудно воспроизвести или уникальны для конкретных пользователей. Сейчас получаю 100+ человеко-часов в месяц на саппорт, 20% из процентов черна пользователей по причине качества продукта, по-факту числа еще больше.
Продукт выделяет время на улучшения и рефакторинги, но приоритет сейчас на те решения которые нужны сейчас и где больше всего изменений. Есть возможность потратить время на очередную стабилизацию, но не знаю за что хвататься, такое впечатление, что нужно "переписать все".
Знаю что каждый кейс уникален по своему, но может кто-то что-то подскажет? Что почитать? Какие стратегии использовать и тп?