Телеграмм чат группы datasciencecourse страница 4364

каждый скор обсчета на каком-то сиде - это случайная величина, как показывает практика - примерно нормально распределённая, поэтому после n запусков получаем выборочную дисперсию в n раз меньше

источник

01:15пожаловаться #12

K-S in Machine learning

по факту, конечно, не в n раз, поскольку сетки скоррелированные между собой получаются. Но все равно дисперсия уменьшается

источник

01:17пожаловаться #13

Ibp in Machine learning

высокая дисперсия - это другими словами - переобучение, а высокое смещение - получается - недообучение

источник

01:22пожаловаться #14

K-S in Machine learning

обычно, конечно, алгоритмы, обученные на разных сидах, получаются чересчур скоррелированными. Поэтому ясное дело их усреднение никакого профита не приносит (но и не ухудшает качество, ясное дело). Но в данной сореве, сетки, по всей видимости, попадают в достаточно разные локальные минимумы при разной инициализации -- поэтому тут это и работает

источник

01:23пожаловаться #15

Sergey Salnikov in Machine learning

на логреге не пробовал усреднять по сидам?

источник

01:24пожаловаться #16

Ibp in Machine learning

получается если добавляете в модель случайность вызванную чем то : данными или каким то вероятностным способом влияющим на алгоритм, что делает сид, то вы уменьшаете переобучение, то есть уменьшаете дисперсию, вроде так

источник

01:24пожаловаться #17

K-S in Machine learning

Sergey Salnikov

на логреге не пробовал усреднять по сидам?

нет, но там это не должно особо работать. У линейных моделек самих по себе дисперсия небольшая

источник

01:25пожаловаться #18

Sergey Salnikov in Machine learning

а, ну да, и биас большой, tradeof

источник

01:25пожаловаться #19

K-S in Machine learning

угу

источник

01:25пожаловаться #20