Size: a a a

Machine learning

2020 December 25

SS

Sergey Salnikov in Machine learning
ну хорошо хоть эту нудь можно пройти бесплатно. а дальше как?
источник

А

Артем in Machine learning
Sergey Salnikov
ну хорошо хоть эту нудь можно пройти бесплатно. а дальше как?
Сам хотел бы узнать, может и зря отказываюсь
источник

Р

Роман in Machine learning
Где можно почитать про масштабирование признаков, чтобы понимать когда это важно, когда не очень или вообще бессмысленно (как от алгоритма зависит, как от задачи)?
источник

SS

Sergey Salnikov in Machine learning
если коротко - то масштабирование нужно для линейных моделей (иначе модель будет пытаться подогнаться под большие признаки), для метрических (kNN), иначе поедет метрика, и если есть градиентный спуск (в том числе сетки), чтобы сходилось быстрее
источник

SS

Sergey Salnikov in Machine learning
а вообще тут картинку приводили по моделям
источник

SS

Sergey Salnikov in Machine learning
источник

Р

Роман in Machine learning
а коэффициенты в регрессии не скомпенсируют разный масштаб? (если я не хочу смотреть важность признаков по коэффициентам, а просто предсказывать)
источник

K

K-S in Machine learning
Может понадобиться значительно больше итераций для сходимости град спуска
источник

SS

Sergey Salnikov in Machine learning
скомпенсирует, но во время обучения эти бОльшие признаки будут вносить бОльшую ошибку, что может дезориентировать модель
источник

i

igor in Machine learning
Роман
а коэффициенты в регрессии не скомпенсируют разный масштаб? (если я не хочу смотреть важность признаков по коэффициентам, а просто предсказывать)
Скиена пишет нормализации также нужна чтобы не было накопления погрешности
источник

Р

Роман in Machine learning
Спасибо всем
источник

I

Ibp in Machine learning
Konstantin
Всем привет! Есть таблица с клиентами и их денежными операциями. Так же есть таблицы с их активностью в двух компаниях, причем один клиент обслуживается только в одной компании. Каким образом можно узнать, какие из клиентов перешли к конкуренту, то есть раньше обслуживались в другой компании?? Попробовал применить кластеризацию, как вообще решаются такие задачи?
Если это платежные операции, то они скорее всего представлены в виде временных рядов. Если принять гипотезу, что схема платежей при переходе к другому клиенту не изменилась, то можно сравнить ряды по расстоянию между ними. Для этого есть разные меры, в том числе и евклидова, вроде, nneighbors посчитать можно. Но я бы для рядов посоветовал Dynamic Time Warping (DTW). И опробовал бы так: для каждого ряда поискал в общей куче ближайшего соседа. Понятно, что каждому ряду всегда найдется пара, но для идентичных мне думается будет какой то минимальный порог плюс минус,  вот его его нужно чисто субъективно определить, если нет реального примера перехода в данных и по этому порогу уже судить, есть ли пара для данного ряда в другой организации.

DTW хорошо реализован в библиотеке tslearn - https://tslearn.readthedocs.io/en/stable/user_guide/dtw.html, помоему, там даже есть специальная приблуда чтобы из кучи рядов самый близкий вытащить.
Ну я бы так попробовал бы сделать.
источник

V

Valek in Machine learning
источник
2020 December 26

AO

Alex Ololo in Machine learning
Реб, видели новый курс от карпова? С валерой во главе команды?) за 2000 usd за полгода? Что скажете?
источник

V

Vlad in Machine learning
Тоже заинтересовал, но 150к чёт жалко)
источник

AO

Alex Ololo in Machine learning
Это скорее уже для дядей с работой)
Задачи восновном бизнесовые.
источник

i

igor in Machine learning
Alex Ololo
Реб, видели новый курс от карпова? С валерой во главе команды?) за 2000 usd за полгода? Что скажете?
Психолог без научных статей даёт курсы по области в которой не эксперт за 150к? Ну это хауто. Для макарон
источник

AO

Alex Ololo in Machine learning
Он не ведет его
источник

AO

Alex Ololo in Machine learning
Там команду посмотртик
источник

AO

Alex Ololo in Machine learning
Е
источник