Size: a a a

Machine learning

2020 June 22

y

yithian in Machine learning
Визуализация - моё почтение. Всякие shap интегрированы. Чисто символические пайплайны уже дают представление об общей картине, да.
источник

y

yithian in Machine learning
K-S
Что кроме таргет энкодинга?
Как будто этого мало!)
источник

K

K-S in Machine learning
Sergey Salnikov
я для исследований использую, где нужно получить общую картинку, а не гоняться за пятым знаком после запятой. весьма быстр для этого, и визуализатор обучения - хорошее подспорье
Лгб даже на cpu вроде быстрее гпушного катбуста
источник

SS

Sergey Salnikov in Machine learning
яндексы утверждают обратное ) и приводят графики
источник

K

K-S in Machine learning
Катбуст ведь под капотом строит фактически несколько моделей, поэтому ему очень сложно даже на гпу тягаться
источник

y

yithian in Machine learning
K-S
Лгб даже на cpu вроде быстрее гпушного катбуста
О, спасибо.
источник

K

K-S in Machine learning
Sergey Salnikov
яндексы утверждают обратное ) и приводят графики
Маркетинг:/
источник

SS

Sergey Salnikov in Machine learning
не, не есть и сторонние сравнения в интернетах, catboost там тоже неплох
источник

SS

Sergey Salnikov in Machine learning
* ну есть
источник

K

K-S in Machine learning
А если в лгб еще включить отбор признаков на основе градиентов в GOSS, то он еще быстрее
источник

SS

Sergey Salnikov in Machine learning
в catboost-е тоже можно много чего включить, просто не всё это документировано
источник

y

yithian in Machine learning
Ну, быстрее - это хорошо. Если быстрее на порядок, например. Прежде всего интересует возможно ли в принципе какой-то результат получить на серверной машине за разумное время.
источник

K

K-S in Machine learning
У лгб — да. Лгб же еще и под пайспарк есть, например. Катбуст вроде все собирался сделать, но насколько я понимаю, до сих пор нет
источник

SS

Sergey Salnikov in Machine learning
я гоня cb на выборке в несколько млн записей, 10 полей, 100 естиматоров - фитится за несколько секунд
источник

K

K-S in Machine learning
А глубина какая, лр?
источник

K

K-S in Machine learning
Ну и 10 полей — это очень мало :/ деревья не по early stopping подбираете?
источник

K

K-S in Machine learning
В общем лично для меня катбуст — это все какие-то уступки. Для себя не вижу преимуществ перед лгб. На cpu кэтбуст — это вообще неработающее нечто, честно говоря :/ гпу — еще ок, но не всегда она есть
источник

y

yithian in Machine learning
Датасет примено 3кк на 100. Причём среди 100 фич несколько категориальных размером под сотню каждая.
источник

SS

Sergey Salnikov in Machine learning
грубина дефолтная, да, по early stopping, но это чисто чтобы ускорить, мне не нужно искать лучшее качество.
источник

K

K-S in Machine learning
yithian
Датасет примено 3кк на 100. Причём среди 100 фич несколько категориальных размером под сотню каждая.
Ну вот даже интереса ради. Категорий несильно много, поэтому можно влоб лейблэнкод попробовать для лгб. Сравни качество и скорость
источник