Size: a a a

Machine learning

2021 January 05

N

Nikita in Machine learning
упс
источник

K

K-S in Machine learning
Sergey Salnikov
ну да, но всё равно, получается мы обучаем на train-test части несколько моделей, и сравниваем их на контроле - какая модель лучше. да, там скор будет отличаться от cv, но насколько оправдано сравнение моделей на одном фолде?
На самом деле отчасти вы правы, во многих соревнованиях выигрывают зачастую не модели с наилучшей обобщающей способностью, а модели просто показавшие лучшее качество на каком-то конкретном куске данных. Такая жизнь ... :/
источник

I

Ibp in Machine learning
наверное по этому соревнования и реальные задачи преследуют разные цели
источник

K

K-S in Machine learning
А чем вам соревнования — не реальные задачи?
источник

I

Ibp in Machine learning
на соревнованиях, вообще можно перебором без всяких моделей получить высокий результат, поэтому там и есть часто ограничения на количество отправляемых решений в день
источник

K

K-S in Machine learning
😂😂ну-ну)) перебором — высокий скор
источник

K

K-S in Machine learning
Нет, нельзя
источник

I

Ibp in Machine learning
ну не перебором уж прямо в лоб а используя hill climbing алгоритм
источник

K

K-S in Machine learning
Ограничение делают для того, чтобы не пробивали паблик лб
источник

K

K-S in Machine learning
Но приват ведь по прежнему скрыт
источник

K

K-S in Machine learning
А пробинг лидерборда хоть и может помочь, но не критически.

Во всех соревнованиях итоговый скор все равно подсчитывается по приватному скрытому скору. То есть пробинг по сути может помочь лишь в понимании баланса классов в тесте, например
источник

I

Ibp in Machine learning
источник

I

Ibp in Machine learning
статья об этом
источник

I

Ibp in Machine learning
K-S
А чем вам соревнования — не реальные задачи?
ну главное отличие, что в практике главное не конкретный результат на каких то данных а модель умеющая работать на более обобщенных данных, ну то есть показывающая хор результат в динамике, что ли
источник

K

K-S in Machine learning
Ibp
ну главное отличие, что в практике главное не конкретный результат на каких то данных а модель умеющая работать на более обобщенных данных, ну то есть показывающая хор результат в динамике, что ли
да вообще не факт. В энтерпрайзе -- да, перформанс модели, как правило, не самый важный показатель. А если речь о каком-либо рисерче (на каггле таких соревнований достаточно) именно наибольшая предиктивная сила -- главная цель
источник

I

Ibp in Machine learning
ну может быть, но в целом мы не знаем же как устроители отбирали данные для финального скора, по какому принципу
источник

K

K-S in Machine learning
так речь о паблик лидерборде. А итоговые места распределяются исходя из скоров на приватном лб
источник

K

K-S in Machine learning
Ibp
ну может быть, но в целом мы не знаем же как устроители отбирали данные для финального скора, по какому принципу
не очень понимаю. Что вы имеете в виду под "в целом мы не знаем же как устроители отбирали данные для финального скора, по какому принципу"?
источник

I

Ibp in Machine learning
K-S
так речь о паблик лидерборде. А итоговые места распределяются исходя из скоров на приватном лб
а в чем кстати разница?
источник

I

Ibp in Machine learning
K-S
не очень понимаю. Что вы имеете в виду под "в целом мы не знаем же как устроители отбирали данные для финального скора, по какому принципу"?
данные для теста
источник