Alina Golkina
Спасибо ребят! Мне еще ооочень много изучать и изучать)))
Кстати, трансформер данных должен быть в пайплайне для более корректной cv, поскольку некоторые преобразования данных при обучении используют информацию из валидации, это переобучение, как раз увеличение дисперсии метрики, что плохо. Также в случае использования таргет энкодера категориальных признаков, к примеру, нужно делать кодирование довольно заковыристым образом, в прямую переобучение из-за утечки таргета. Так что в этом ещё может быть причина некорректной оптимизации грид серчем.