есть две модели, нужно сравнить их на cv. прогоняем обе модели на одинаковых сплитах cv (т.е. фиксируем random_state), получаем два массива related: на каждом фолде по два скора разных моделей. проверяем гипотезу что они имеют одинаковое среднее (если скоры имеют нормальное распределение), используем t-test (why not?), если слишком ненормальное - что-нибудь непараметрическое.