Телеграмм чат группы datasciencecourse страница 4633

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7661 membersпожаловаться на группу

2021 January 12

АГ

Артём Глазунов... in Machine learning

Alexey

Кстати, Демешев очень интересно и задания отличные. Я до середины дошел,там R несложный (меня это раньше останавливало)

Демешев хорош, но это не машинное обучение, а просто предтечи, для углубленного понимания стат стороны линейных моделей, ну немного Байеса есть в конце, и ещё пара методов. По регуляризации у него крайне мало, скорее на пальцах. Мне очень понравился его курс, но он немного о другом.

источник

22:06пожаловаться #1

АГ

Артём Глазунов... in Machine learning

R прекрасен, кстати)

источник

22:06пожаловаться #2

DP

Dmitry Penzar in Machine learning

пока вы не вышли за пределы уже написанных пакетов

источник

22:07пожаловаться #3

K

K-S in Machine learning

Артём Глазунов

Демешев хорош, но это не машинное обучение, а просто предтечи, для углубленного понимания стат стороны линейных моделей, ну немного Байеса есть в конце, и ещё пара методов. По регуляризации у него крайне мало, скорее на пальцах. Мне очень понравился его курс, но он немного о другом.

так там нигде и не заявляется, что это мл.

источник

22:07пожаловаться #4

АГ

Артём Глазунов... in Machine learning

пока вы не вышли за пределы уже написанных пакетов

Это да, всему свое место)

источник

22:07пожаловаться #5

DP

Dmitry Penzar in Machine learning

и желательно, пакетов tidyverse или на нее опирающихся

источник

22:07пожаловаться #6

DP

Dmitry Penzar in Machine learning

пример Julia показывает, что можно было сделать лучше, но статистики, делавшие R были уверены, что они самые умные)

источник

22:08пожаловаться #7

K

K-S in Machine learning

Артём Глазунов

Демешев хорош, но это не машинное обучение, а просто предтечи, для углубленного понимания стат стороны линейных моделей, ну немного Байеса есть в конце, и ещё пара методов. По регуляризации у него крайне мало, скорее на пальцах. Мне очень понравился его курс, но он немного о другом.

в специализации на курсере о регуляризации еще меньше)

источник

22:09пожаловаться #8

АГ

Артём Глазунов... in Machine learning

так там нигде и не заявляется, что это мл.

Это я для тех, кто курс выбирает, на всякий

источник

22:09пожаловаться #9

АГ

Артём Глазунов... in Machine learning

в специализации на курсере о регуляризации еще меньше)

Ну не меньше, но мало, согласен, как уже было сказано, на пальцах. А дальше человек сам будет копать, подразумевается так, думаю

источник

22:10пожаловаться #10

АГ

Артём Глазунов... in Machine learning

Может это и правильно?

источник

22:10пожаловаться #11

K

K-S in Machine learning

Артём Глазунов

Ну не меньше, но мало, согласен, как уже было сказано, на пальцах. А дальше человек сам будет копать, подразумевается так, думаю

ну вроде об дисперсии оценок в курсе вообще речи не шло. Просто "мултиколлинеарность - это не очень хорошо"

источник

22:12пожаловаться #12

АГ

Артём Глазунов... in Machine learning

ну вроде об дисперсии оценок в курсе вообще речи не шло. Просто "мултиколлинеарность - это не очень хорошо"

Ну там о ней говорили больше в практическом смысле, показывали параметры, давали поиграть, ещё в рекомендашках упоминалась.

источник

22:14пожаловаться #13

АГ

Артём Глазунов... in Machine learning

Как уже говорилось, Демешев раскрывает больше стат сторону, это бесспорно

источник

22:14пожаловаться #14

АГ

Артём Глазунов... in Machine learning

Alexey

Я правильно понимаю, что регуляризация нужна для уменьшения дисперсии оценок, поэтому большие значения регрессоров это плохо? но странно все равно - большие значения == высокая дисперсия?

Ну, кстати, на вопрос мы немного не ответили) Ведь на практике регуляризация используется для борьбы с переобучением. То есть грубо модель стремится запомнить обучающаю выборку, растит свои параметры. При этом при переходе к другой обучающей выборке оценки параметров будут уже другие (ну вот как раз дисперсия оценок) . На тесте качество будет не очень, потому что параметры подстроены именно под обучение. Вводя штраф, мы ей мешаем это сделать, усложняем ей работу, коэффициенты не так растут, в результате предсказания теста лучше. То есть мы как бы упрощаем модель. Для сетей популярна регуляризация дропаутом, мы сеть прореживаем, так её упрощаем, при этом делаем это каждый раз (грубо для каждого объекта обучения) случайно, то есть не даём набрать веса, подогнаться под обучение, при этом относительный масштаб весов выравнивается, нет очень больших или маленьких весов. То есть грубо, имея мало данных и много признаков можно подогнаться под обучение. И чем больше признаков, тем больше нужно данных, чтобы модель уловила в параметрах все тонкости каждого. Вводим штраф, ограничиваем веса и не даём каким-то параметрам "вылезать" по масштабу из общей массы (а вдруг признак шумовой? ) в результате обобщающая способность модели лучше, что выражается в результатах на разных тестах. Чёт много я написал, сорри))

источник

23:11пожаловаться #15

V

Vladislav-kun in Machine learning

Сорри за офтоп, не принимайте за рекламу)
Что это за курс такой? Отзывов нет, тут вроде никто не обсуждал. Новое что-то?

https://www.coursera.org/specializations/maths-for-data-analysis

Математика для анализа данных

Offered by National Research University Higher School of Economics. За каждой стандартной моделью и конструкцией в Data Science стоит математика, благодаря которой эти модели функционируют. Если вы хотите работать с данными на серьезном уровне и понимать, как устроены методы машинного обучения, то знание математических основ вам просто необходимо. В этой специализации мы изучим широкий спектр математических инструментов и рассмотрим некоторые их приложения к анализу данных. Будут рассмотрены такие важные разделы математики, как дискретная математика, линейная алгебра, математический анализ и теория вероятностей. Материалы курсов разработаны с учетом современного состояния Data Science и покрывают все темы, необходимые для для дальнейшего развития в данном направлении. Чтобы сделать обучение более практико-ориентированным, мы сопровождаем лекции примерами и задачами, возникающими при реальной работе с данными, и показываем, как решать подобные задачи с помощью Python. Курсы рекомендуется проходить в том порядке…

источник

23:14пожаловаться #16

V

Vladislav-kun in Machine learning

От ВШЭ

источник

23:14пожаловаться #17

АГ

Артём Глазунов... in Machine learning

От ВШЭ

Что немного смущает, написано начальный уровень... Хватит ли его ?

источник

23:16пожаловаться #18

A

Alexey in Machine learning

что-то новое видимо. И Демешев в преподах...

источник

23:16пожаловаться #19

V

Vladislav-kun in Machine learning

Артём Глазунов

Что немного смущает, написано начальный уровень... Хватит ли его ?

Ну, это я так понимаю если начинать с первого курса)

источник

23:16пожаловаться #20