Size: a a a

Machine learning

2020 December 06

i

igor in Machine learning
В чем вы видите тут проклятье размерности?
источник

АГ

Артём Глазунов... in Machine learning
тут его нет
источник

АГ

Артём Глазунов... in Machine learning
если много брать точек, то евклидово расстояние не будет корректно отображать разницу
источник

АГ

Артём Глазунов... in Machine learning
то есть сгруппировать не удастся по нему
источник

АГ

Артём Глазунов... in Machine learning
для корректности, тут я делал не нормирование на 1, а стандартизацию для каждого ряда, то есть вычитал среднее и делил потом на std
источник

🐙

🐙 in Machine learning
#C6W1 отзывы
Ребят, помогите с парой вопросов:
1. LogisticRegression ругается что solver не сходится. В задании написано использовать с параметрами по умолчанию, но мне кажется, что они поменялись; подскажите, какие параметры нужны в задании?
2. Не понимаю, как могут два разных scorer'а выдавать одинаковые результаты? В чём может быть ошибка?

UPD: задача сдалась и так. Я почекал предыдущие версии scikit - там тоже стоит max_iter=100 как дефолт, так что видимо норм. Повышение max_iter не повлияло на результаты. По кроссвалидации - accuracy принялось нормально, roc не принялся, очевидно, пробема в нём.
источник

🐙

🐙 in Machine learning
источник

GB

Gennady Borisov in Machine learning
Артём Глазунов
жирным это центр кластера
Огромное спасибо)
источник

SS

Sergey Salnikov in Machine learning
хто все эти люди?
источник

SS

Sergey Salnikov in Machine learning
Артём Глазунов
у меня в свое время получилось неплохо кластеризовать ряды с помощью агломеративной кластеризации. Но, тут нужно сначала отнормировать значения рядов на 1(чтобы можно было сравнивать и строить на плоскости), выделить временной промежуток ( я брал месяц (24*30 точек) и вырезать соответствующие фрагменты (если использовать всю длину, то может негативно сказаться "проклятье размерности", слишком много координат для евклидова расстояния, я брал 30 точен). Далее я просто находил центры кластеров через усреднение, а качество построенных кластеров смотрел визуально, изображая все фрагменты на плоскости. Проверял по суммарному расстоянию от центра кластера и среднему расстоянию от центра. Количество кластеров изначально прикинул через elbow rule и коэффициент силуэта (посмотрите библиотеку yellowbrick). Довольно быстро удалось сгруппировать ряды по степени похожести, выделить наиболее похожие.
а по тайму не сдвигал? или данные уже подогнаны по времени? сравнение рядов - вообще интересная тема, например - в контексте нахождения паттернов трейдинга
источник

АГ

Артём Глазунов... in Machine learning
Sergey Salnikov
а по тайму не сдвигал? или данные уже подогнаны по времени? сравнение рядов - вообще интересная тема, например - в контексте нахождения паттернов трейдинга
нет, тайм не трогал. Вообще, еще пробовал DTW,  и кластеризацию по производным от рядов признакам, но результаты были значительно хуже. Думаю, это связано с тем, что ряды соответствуют своим гео зонам тут, при этом ярко выражена сезонность. При данной кластеризации как раз важно было не сдвигать, а dtw  рассматривает похожесть, но может сдвигать точки, в результате форма была похожа, но все перемешано по времени.
источник

АГ

Артём Глазунов... in Machine learning
а признаки несли очень мало инфы в себе, в результате выбрал просто фрагмент ряда в качестве признаков, и все получилось)
источник

АГ

Артём Глазунов... in Machine learning
В трейдинге такое может на прокатить, потому что мы же ищем именно паттерны, поэтому важна только форма. Тут может сработать как раз DTW...
источник

MG

Maxim Grinin in Machine learning
источник

MM

Mira Mironova in Machine learning
Спасибо!
источник

🐙

🐙 in Machine learning
Ребят, такое впечатление, что все, кто пробовал #C6W2 про отзывы, перешли на другие курсы из-за его багованности. На форуме ни то, что ответов - вопросов на второй неделе почти нет, как и тут :(
У меня
3.8.3 (default, May 19 2020, 18:47:26)
[GCC 7.3.0]
sklearn:  0.23.2
и я не могу сдать ни одно задание. Собственно, судя по форуму - не я один. Если кто-то может помочь - буду благодарен 🙏🏼
источник

i

igor in Machine learning
Не могу бро сорян
источник

AG

Aida Galeyeva in Machine learning
#C1W1 Отзыв
как увеличить размер скрина?
источник

AG

Aida Galeyeva in Machine learning
источник

KK

Konstantin Kastet in Machine learning
кто -нибудь может подсказать в чем проблема?
источник