Телеграмм чат группы datasciencecourse страница 4302

Size: a a a

Machine learning

7515 membersпожаловаться на группу

2020 November 07

ОК

Оля Криволейко... in Machine learning

тк данных нет

источник

15:54пожаловаться #1

Ibp in Machine learning

Рядетялям за права типографий за бапки: эту книжку майкрософт бесплатно раздает. Как в прочем и все авторы - ибо они заинтересованы чтобфы как можно больше читателей ознакомилось с контентом, а за деньги бъются люди не связанные с оным.

источник

15:55пожаловаться #2

Vitaly S in Machine learning

Оля Криволейко

проблема в том, чтобы прогноз сделать на будущее

Все модели для этого и существуют. Я так понял, что вы новичок. Поэтому вам либо заказать работу, либо учиться с азов, что не быстро.

источник

15:57пожаловаться #3

Sergey Salnikov in Machine learning

в догонку по kNN - почему он иногда лучше. kNN хорошо работает на кластеризованных данных. например, классификация точке на плоскости, если они расположены компактно кучками, то kNN различит их легко, правда и GB тоже их различит, построит ограничивающие гиперповерхности. Но если допустим на границах кластеров появятся точки другого класса, то kNN тупо присвоит им неправильную метку, и всё, модель не изменится (потому там нет модели, kNN ничего не запоминает). а бустинг попытается выцепить эти пограничные точки, чем сильно искривит ограничивающие поверхности, что приведёт к переобучению.

источник

16:06пожаловаться #4

Ibp in Machine learning

Gennady

Благодарю! Я не загружаю весь датасет, только данные по расчетному региону(или вы что-то другое имеете ввиду). А дифференцирование по году в данном случае разве можно делать? В указаниях к третьей недели говорилось что длинноволновые сотавляющие уйдут после регрессии. Они в каком-то смысле и ушли. А кроме того в примерах пятого курса вроде бы исходный ряд(недифференцированный) на вход SARIMA для обучения подавался. И еще вопрос, если позволите. Вот я допустим, обучил модель SARIMA на продифференцированных на год рядах. Чтобы получит из нее предсказание нужно будет предсказанные моделью данные обратно проинтегрировать на год?

а понял: тут я упомянул дифферциацию в качестве вычитания, а не взятия производной

источник

16:12пожаловаться #5

Gennady in Machine learning

Ibp

Mastering Azur Machine Learning.pdf

(11.93 Мб)

для преобразования данных я пользовался даском, у меня данные были за три года, всю работу практически сделал на компе, но у меня 16 гиг оперативка, 6 думаю будет мало. Народ говорит что надо пользоваться колабом. Могу еще посоветовать азур - ткт его микрософт сейчас во всю рекламирует.

Большое, спасибо! Вот я тоже думаю, что 6 гиг маловато просто. А даск это что, простите?

источник

18:25пожаловаться #6

Andrey Korzhun in Machine learning

А нет ли у Яндекса отдельного хорошего курса по статистике или какой посоветуете?

источник

18:28пожаловаться #7

Ibp in Machine learning

Gennady

Большое, спасибо! Вот я тоже думаю, что 6 гиг маловато просто. А даск это что, простите?

Data Science With Python And Dask by Jesse C. Daniel.pdf

(8.07 Мб)

даск это достаточно простая библиотека типа пандас, все то же самое, только для распределенных вычислений

источник

18:32пожаловаться #8

Gennady in Machine learning

Ibp

а понял: тут я упомянул дифферциацию в качестве вычитания, а не взятия производной

А разве физический смысл вычитания здесь не есть производная? Если вычитание со смещением в 1 год, то это скорость изменения сигнала за год. Если смещение в 1 день, то это скороть изменения в 1 день. Например если вызовы в прошлом году будут в точности на 10 больше по сравнению с текущим годом, то вычитание прошлого года нам даст 10 - т.е. годовое увеличение.

источник

18:36пожаловаться #9

Ibp in Machine learning

ну наверное да

источник

18:37пожаловаться #10

Ibp in Machine learning

не думал об этом

источник

18:38пожаловаться #11

Anton Rogozin in Machine learning

Andrey Korzhun

А нет ли у Яндекса отдельного хорошего курса по статистике или какой посоветуете?

Ты четвертый курс специализации проходил или тебе хочется больше глубины?

источник

20:13пожаловаться #12

Andrey Korzhun in Machine learning

Anton Rogozin

Ты четвертый курс специализации проходил или тебе хочется больше глубины?

В глубину.
Чтобы самому уметь написать статфункции

источник

20:49пожаловаться #13

Anton Rogozin in Machine learning

Andrey Korzhun

В глубину.
Чтобы самому уметь написать статфункции

Можно попробовать эти курсы:
https://stepik.org/course/76 - Основы статистики
https://stepik.org/course/524 - Основы статистики. Часть 2
https://stepik.org/course/2152 - Основы статистики. Часть 3

Stepik: online education

Основы статистики

Курс знакомит слушателей с основными понятиями и методами математической статистики. В течение трех недель мы рассмотрим наиболее широко используемые статистические методы и принципы, стоящие за ними. Полученных знаний будет достаточно для решения широкого круга задач, возникающих в рамках исследовательской работы.