Size: a a a

Machine learning

2021 January 04

i

igor in Machine learning
Кросвалидауию не надо интерпретировать
источник

i

igor in Machine learning
С её помощью выбираем модель
источник

SS

Sergey Salnikov in Machine learning
есть две модели, нужно сравнить их на cv. прогоняем обе модели на одинаковых сплитах cv (т.е. фиксируем random_state), получаем два массива related: на каждом фолде по два скора разных моделей. проверяем гипотезу что они имеют одинаковое среднее (если скоры имеют нормальное распределение), используем t-test (why not?), если слишком ненормальное - что-нибудь непараметрическое.
источник

K

K-S in Machine learning
Sergey Salnikov
есть две модели, нужно сравнить их на cv. прогоняем обе модели на одинаковых сплитах cv (т.е. фиксируем random_state), получаем два массива related: на каждом фолде по два скора разных моделей. проверяем гипотезу что они имеют одинаковое среднее (если скоры имеют нормальное распределение), используем t-test (why not?), если слишком ненормальное - что-нибудь непараметрическое.
Наблюдения не являются независимыми
источник

i

igor in Machine learning
Да именно
источник

SS

Sergey Salnikov in Machine learning
так нигде в ml скоры не являются независимыми
источник

i

igor in Machine learning
Это неправда
источник

DP

Dmitry Penzar in Machine learning
Sergey Salnikov
так нигде в ml скоры не являются независимыми
а кто-то часто в cv сует т-тест?
источник

DP

Dmitry Penzar in Machine learning
я честно только здесь увидел
источник

K

K-S in Machine learning
Dmitry Penzar
а кто-то часто в cv сует т-тест?
Часто
источник

i

igor in Machine learning
Может где то в курсе так было?
источник

SS

Sergey Salnikov in Machine learning
статья на хабре есть хорошая, по мерсам
источник

DP

Dmitry Penzar in Machine learning
обычно либо "ci", либо бутстрэп
источник

DP

Dmitry Penzar in Machine learning
ну если там делают t-test, то нехорошая
источник

K

K-S in Machine learning
Sergey Salnikov
так нигде в ml скоры не являются независимыми
Так или иначе мы пытаемся использовать инструмент, который требует одно, а у нас оно не выполнено.
источник

SS

Sergey Salnikov in Machine learning
так частно применяются инструменты для нормального к около-нормальным, эмпирически они работают
источник

DP

Dmitry Penzar in Machine learning
Sergey Salnikov
так частно применяются инструменты для нормального к около-нормальным, эмпирически они работают
и?
источник

DP

Dmitry Penzar in Machine learning
проблема не в нормальности, а в зависимости
источник

DP

Dmitry Penzar in Machine learning
аналогия ложная, некоторые допущения легче относятся к своим нарушениям, некоторые - строже
источник

K

K-S in Machine learning
Sergey Salnikov
так частно применяются инструменты для нормального к около-нормальным, эмпирически они работают
Так там в пределе действительно аппроксимация начинает работать, а зависимые сэмплы независимыми никогда не станут
источник