Size: a a a

Machine learning

2021 January 04

SS

Sergey Salnikov in Machine learning
источник

i

igor in Machine learning
Более ого корреляция увеличивает дисперсию часто
источник

DP

Dmitry Penzar in Machine learning
простите, вот и чиго с того, что она на хабре выложена?
источник

SS

Sergey Salnikov in Machine learning
там хорошая интуиция объясняется
источник

DP

Dmitry Penzar in Machine learning
это даже не статья в рецензируемом журнале
источник

SS

Sergey Salnikov in Machine learning
ну эмпирически слегка коррелированные базовые в random forest хорошо работают
источник

DP

Dmitry Penzar in Machine learning
???
источник

DP

Dmitry Penzar in Machine learning
вы смешиваете теплое с мягким
источник

SS

Sergey Salnikov in Machine learning
будет время. специально для тебя нарою статью поумнее, пробегала недавно, на аглицком, там предлагался модифицированный t-test для 5x2 cv
источник

i

igor in Machine learning
У меня вчера тоже студент дал верный ответ. Но решение неверное
источник

i

igor in Machine learning
В таком случае это нолб
источник

DP

Dmitry Penzar in Machine learning
Sergey Salnikov
будет время. специально для тебя нарою статью поумнее, пробегала недавно, на аглицком, там предлагался модифицированный t-test для 5x2 cv
я буду признателен. Но применять вчистую t-test - хрень
источник

DP

Dmitry Penzar in Machine learning
это как к матрицам расстояний применяют t-test. Да, применяют, да, видел такое, И что? Это не от большого ума делается
источник

PS

Pavel Savin in Machine learning
Dmitry Penzar
я буду признателен. Но применять вчистую t-test - хрень
Справедливости ради, это лучше, чем просто сравнивать средние
источник

DP

Dmitry Penzar in Machine learning
Sergey Salnikov
ну эмпирически слегка коррелированные базовые в random forest хорошо работают
хотя бы ибо из формулы-обоснования random forest не следует требования полного отсутствия корреляции
источник

K

K-S in Machine learning
Интуиция там действительно есть и, скажем так, если максимально «огрубить»:

то, скажем так, если у вас есть одна модель с 5x2 скорами и есть вторая модель, у которой все 5х2 скоров лучше, чем у первой, то вполне можно предположить, что вторая модель действительно лучше отработает на отложенном наборе данных. Но это:
1) не факт
2) на уровне эвристики
источник

DP

Dmitry Penzar in Machine learning
Pavel Savin
Справедливости ради, это лучше, чем просто сравнивать средние
ну вот я не уверен
источник

DP

Dmitry Penzar in Machine learning
в одном случае очевидно отсутствие статистики
источник

DP

Dmitry Penzar in Machine learning
в другом случае она вроде есть, но p-value полученное никак нельзя интерпретировать
источник

PS

Pavel Savin in Machine learning
Ну, в другом случае это тоже статистика с большой натяжкой
источник