Говорю основываясь только на том, что видел я и другие коллеги в той же стране.
1) фит_предикта бы не хватало, если б моделирование занимало больше 15% времени от всей работы
2) вполне джун может знать алгоритмы лучше. Это для наших не скажу, что частая, но нисколько не удивительная ситуация. Задание сеньор дать-то может, но разницы между катбустом условным и хгб может вообще не знать
3) переписывать sklearn алгоритмы для прототипипования? Это вы, кажется, переборщили. Мб такое и делают, но это скорее исключение из правил. Все равно обучение потом происходит в пайспарке, а переписывать алгоритмы из mllib. Не знаю таких мест, где бы это делали
4) про постановку задачи, выбор метрики, подготовку данных я как раз говорил, что в этом сеньор, разумеется, более прокачан. Вообще в любых вопросах, связанных с бизнесом, он, конечно, будет опытнее, но об этом речь не шла.
Значит по первому пункту. Получение модели, дающей value - это не только моделирование и танцы с бубнами вокруг метрик. А еще валидация по экономическому эффекту, а еще анализ сложности внедрения, а еще мониторинг и прочее. По второму - спорно, но может такое и бывает. В Citibank NA ни для кого скидок нет, каждые полгода переаттестация, недавно, например, гоняли по типам важности в том же CatBoost, я Стасу Кириллову уже, наверное, оскомину набил со своими вопросами, более того, последний этап - это тебя спрашивают по статьям, короче, за три месяца дают гору статей и на переаттестации специально по ним выборочно спрашивают. По третьему - переписывается постоянно. Простой пример, ты недавно попросил класс квантильной регрессии, с твоих слов, работает медленно, берем и переписываем. Надо биннинг сделать, да, можно взять KBinsDiscretizer, но в реальности мы бины делает по WoE, PSI, риск-стабильности. PowerTransformer для подбора преобразований также переписывается, потому для левосторонней асимметрии (редка, но бывает) норовит возведение в квадрат подсунуть, а лучше бы взять квадратный корень/логарифм между константой и исходным значением. Ну и куча-куча всего, отбор признаков, укрупнение редких категорий