Size: a a a

Machine learning

2021 January 04

DP

Dmitry Penzar in Machine learning
а вы читали статью?
источник

DP

Dmitry Penzar in Machine learning
что скинули?
источник

DP

Dmitry Penzar in Machine learning
вот эту
источник

DP

Dmitry Penzar in Machine learning
там речь они свой 5-2cv предлагают использовать фактически только для accuracy
источник

DP

Dmitry Penzar in Machine learning
Более того, они же и говорят то, о чем вы с нами спорите - что просто t-test на моонте-карло кросс-валидации или kfold кроссвалидации лажает даже для accuracy
источник

DP

Dmitry Penzar in Machine learning
цитируя эту статью:

"Statistical methods such as the bootstrap can be used to calculate defensible nonparametric confidence intervals that can be used to both present results and compare classifiers. This is a simple and effective approach that you can always fall back upon and that I recommend in general."

Что здесь я, например, и рекомендовал.
И автор указывает у подходов, что вы указали те же минусы, что указал я.
источник

SS

Sergey Salnikov in Machine learning
у меня по опыту получалось, что бутстрапы дают большую дисперсию, чем Nx2, наверно потому что классическое разбиение на фолды ровнее покрывает тестами все данные, чем рандомное разбиение бутстрапа
источник

DP

Dmitry Penzar in Machine learning
а в чем проблема большей дисперсии?
источник

DP

Dmitry Penzar in Machine learning
и Nx2 в статье, что вы прислали, защщищен только для accuracy
источник

DP

Dmitry Penzar in Machine learning
и там прямо написано даже про то, что величина в знаменателе должна быть примерно нормально распределена.
источник

АГ

Артём Глазунов... in Machine learning
igor
Конечная проверка это тестовые данные это ай ай ди
Дело в том, что метрики на разных тестах и трейнах разные, проверка просто по средним некорректна, надо ещё разбросы учитывать, хочется аппарат статистики как-то применить
источник

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
обычно либо "ci", либо бутстрэп
Но в бутстрепе тоже iid везде предполагается(из того что я смотрел, я сюда приложил один такой источник), то есть не совсем корректно применять и проверку гипотез с его помощью, и интервалы. Буду признателен, если устойчивым модификациями поделитесь, где метод обобщается.
источник

DP

Dmitry Penzar in Machine learning
Артём Глазунов
Но в бутстрепе тоже iid везде предполагается(из того что я смотрел, я сюда приложил один такой источник), то есть не совсем корректно применять и проверку гипотез с его помощью, и интервалы. Буду признателен, если устойчивым модификациями поделитесь, где метод обобщается.
а можете скинуть источник?
iid наших объектов в выборке?
источник

АГ

Артём Глазунов... in Machine learning
Вот
источник

DP

Dmitry Penzar in Machine learning
ну да, здесь про саму выборку. А мы спорили, что в t-test на кросс-валидации iid не получится, даже если в выборке объекты независимые
источник

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
ну да, здесь про саму выборку. А мы спорили, что в t-test на кросс-валидации iid не получится, даже если в выборке объекты независимые
Здесь я с вами полностью согласен
источник

АГ

Артём Глазунов... in Machine learning
То есть и бутстреп здесь не особо подходит, верно же?
источник

АГ

Артём Глазунов... in Machine learning
Я просто не оставляю надежду найти корректный метод)
источник

DP

Dmitry Penzar in Machine learning
не, я к тому, что по логике бутстрэп как раз проблемы не вызовет. У нас частое предположение, что объекты в обучающей выборке независимо брались
источник

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
ну да, здесь про саму выборку. А мы спорили, что в t-test на кросс-валидации iid не получится, даже если в выборке объекты независимые
iid на кросс валидации не получится по определению независимости. Зависимость метрик на фолдах проявляется и через модель, и через пересечение фолдов, которые будут пересекаться по данным, это интуитивно приходит на ум.
источник