Size: a a a

Machine learning

2021 January 13

AF

Aleksey Firstov in Machine learning
Долго искал таблички с не анонимизированными данными, как раз оно и есть)
источник

K

K-S in Machine learning
Aleksey Firstov
Долго искал таблички с не анонимизированными данными, как раз оно и есть)
Так альфа банк — таблички с неанонимными данными)
источник

K

K-S in Machine learning
Aleksey Firstov
Долго искал таблички с не анонимизированными данными, как раз оно и есть)
И как со второй частью задачи? Сама регрессия-то по стандартной схеме скорее всего
источник

AF

Aleksey Firstov in Machine learning
Видимо я пропустил)
Ну я думал вдруг кто увлёкся, до 15 можно команду собрать для участия)
Регрессия на цену плюс предложение цены на страховку, по сути да, desicion making, и надо выйграть по минимальной цене у других игроков
источник

AF

Aleksey Firstov in Machine learning
Вообщем стакать xgboostы просто так не выйдет)
источник

K

K-S in Machine learning
Aleksey Firstov
Вообщем стакать xgboostы просто так не выйдет)
Да лаааадно вам, когда в последний раз таблички выигрывали стаком бустов)
источник

K

Kirill in Machine learning
источник

K

K-S in Machine learning
Aleksey Firstov
Видимо я пропустил)
Ну я думал вдруг кто увлёкся, до 15 можно команду собрать для участия)
Регрессия на цену плюс предложение цены на страховку, по сути да, desicion making, и надо выйграть по минимальной цене у других игроков
Ну вот второе даже чем-то на RL похоже) постановка задачи
источник

AF

Aleksey Firstov in Machine learning
Я бы не сказал, что я вкурсе актуальных соревнований, но видимо давно 😅
Кстати что сейчас актуального по DL на табличках?
Проблема в том, что разметки на цены страховки нет, разметка только на регрессию, в целом можешь и не делать модель классификации, а просто брать предсказания регрессии и умножать на риск, вариантов решения  масса
источник

K

K-S in Machine learning
Aleksey Firstov
Я бы не сказал, что я вкурсе актуальных соревнований, но видимо давно 😅
Кстати что сейчас актуального по DL на табличках?
Проблема в том, что разметки на цены страховки нет, разметка только на регрессию, в целом можешь и не делать модель классификации, а просто брать предсказания регрессии и умножать на риск, вариантов решения  масса
От табличек сильно зависит. Если есть пространственная структура в данных, то CNN. Если есть временная структура, то те же CNN/RNN/трансформеры.

Если ничего такого особого нет, то табнет от гугла. Есть ещё много поделок типа GrowNet’a какого-нибудь, но это пока скорее на уровне поделок
источник

AF

Aleksey Firstov in Machine learning
Tabnet дико проиграл xgboost
источник

AF

Aleksey Firstov in Machine learning
:(
источник

AF

Aleksey Firstov in Machine learning
Я про кастомные настройки
источник

K

K-S in Machine learning
Aleksey Firstov
Tabnet дико проиграл xgboost
Да, у меня тоже Бусты его в 90% случаев выигрывают
источник

AF

Aleksey Firstov in Machine learning
А сколько слов то было 😅
источник

DP

Dmitry Penzar in Machine learning
чего-то я пропустил про tabnet
источник

DP

Dmitry Penzar in Machine learning
смотрю - свежая публикация
источник

DP

Dmitry Penzar in Machine learning
или ее давно уже юзают на самом деле?
источник

K

K-S in Machine learning
Из своего маленького опыта табнета: он лучше бустингов, когда фичи наши однородные(например, как было в MOA соревновании на каггле, где фича 1 — это экспрессия гена А, фича 2 — экспрессия гена Б итд).

А когда данные очень разнородные (например, в банковском скоринге, где много пропусков, кат фичей итд) Бусты пока недосягаемы
источник

K

K-S in Machine learning
Dmitry Penzar
или ее давно уже юзают на самом деле?
Нет, вроде бы с мая 20-го
источник