Size: a a a

Machine learning

2021 January 02

i

igor in Machine learning
Он тоже хороший плюс учебник таха но там много тервара и случ процесслв
источник

i

igor in Machine learning
Александр Куприянов
Хотелось бы, чтобы это был не сборник теорем с доказательствами, а что-то, вырабатывающее интуицию
Напишите в личку если нужно более подробно
источник
2021 January 03

ИД

Илья Дагиль... in Machine learning
Подскажите пожалуйста, фин. помощь может не прийти/прийти позже, чем через 14 дней? Заявка      была принята на рассмотрение в день отправки...
источник

GB

George Boole in Machine learning
Ровно 15
источник

ИД

Илья Дагиль... in Machine learning
George Boole
Ровно 15
О, спасибо, жду!)
источник

V

V in Machine learning
Всем привет. Кто-нибудь запускал обучение на GPU через TensorFlow 2 в WSL2? (Ubuntu 20.04)
источник

DT

Denis Travnikov in Machine learning
Всем привет. Почему LogisticRegression() с параметром class_weight='balanced' дает результат хуже, чем без параметра? Смотрю на roc_auc_score
источник

i

igor in Machine learning
Хуже чем что? На каких данных?
источник

K

K-S in Machine learning
Denis Travnikov
Всем привет. Почему LogisticRegression() с параметром class_weight='balanced' дает результат хуже, чем без параметра? Смотрю на roc_auc_score
А почему она должна помочь? Roc auc зависит только от порядка, а не от абсолютных значений предсказываемых оценках принадлежности к классу.
источник

K

K-S in Machine learning
Как правило, любой апсэмплинг/андерсэмплинг только ухудшает качество. Лучше просто предсказать «вероятности», а потом уже подобрать порог
источник

DT

Denis Travnikov in Machine learning
@iigor00 @ksstat

https://colab.research.google.com/drive/1yfPzfRgpvrCcZoTWW_lb8v4TTKP0KSqO?usp=sharing

Без стратификации норм, а вот стратификация ведет себя странно (уменьшает auc и инвертирует пользу балансирования)
источник

K

K-S in Machine learning
Denis Travnikov
@iigor00 @ksstat

https://colab.research.google.com/drive/1yfPzfRgpvrCcZoTWW_lb8v4TTKP0KSqO?usp=sharing

Без стратификации норм, а вот стратификация ведет себя странно (уменьшает auc и инвертирует пользу балансирования)
1) во-первых. Сами по себе посчитанные ауки ни о чем не говорят. Надо проверить получаемые различия на стат значимость.

2) во-вторых. Какой изначальный баланс классов? Какой размер выборки?
источник

DT

Denis Travnikov in Machine learning
K-S
1) во-первых. Сами по себе посчитанные ауки ни о чем не говорят. Надо проверить получаемые различия на стат значимость.

2) во-вторых. Какой изначальный баланс классов? Какой размер выборки?
баланс классов: 0 - 2316, 1 - 1884
источник

i

igor in Machine learning
Разница может быть и не значимой статистически
источник

i

igor in Machine learning
Во вторых, не ясно на чем вы проверяли на тест или на трейн
источник

DT

Denis Travnikov in Machine learning
K-S
1) во-первых. Сами по себе посчитанные ауки ни о чем не говорят. Надо проверить получаемые различия на стат значимость.

2) во-вторых. Какой изначальный баланс классов? Какой размер выборки?
Как проверять на стат. значимость - куда копать?
источник

K

K-S in Machine learning
Denis Travnikov
Как проверять на стат. значимость - куда копать?
Оцените две модели, которые вы хотите сравнить между собой, на кросс-валидации. И потом сравните т-тестом для зависимых наблюдений (так как кол-во фолдов скорее всего будет небольшим (5-7), то ещё в начале проверьте полученные по cv скоры на нормальность. Например, тестом Шапиро-Уилка)
источник

K

K-S in Machine learning
Denis Travnikov
баланс классов: 0 - 2316, 1 - 1884
А зачем в такой ситуации вообще что-то семплировать? У вас ведь и так дисбаланса нет
источник

DT

Denis Travnikov in Machine learning
K-S
А зачем в такой ситуации вообще что-то семплировать? У вас ведь и так дисбаланса нет
Задание такое
источник

DT

Denis Travnikov in Machine learning
K-S
Оцените две модели, которые вы хотите сравнить между собой, на кросс-валидации. И потом сравните т-тестом для зависимых наблюдений (так как кол-во фолдов скорее всего будет небольшим (5-7), то ещё в начале проверьте полученные по cv скоры на нормальность. Например, тестом Шапиро-Уилка)
Спасибо
источник