Телеграмм чат группы datasciencecourse страница 4318

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7549 membersпожаловаться на группу

2020 November 11

A

Antonina in Machine learning

Виталий

Привет)
Никак не могу разобраться с вопросом в тесте C4W1. При сигма =1, какой нужен объём выборки, чтобы на уровне доверия 95% оценить среднее с точностью 0.1.
Объясните, пожалуйста, что к чему

Привет, разобрался? я что-то в ступоре =/

источник

00:23пожаловаться #1

dg

ds gtd in Machine learning

Здравствуйте! Где можно следить за анонсами курсов от МФТИ? В начале опроса ввел некорректный адрес, не хочу пропускать
Спасибо!

источник

05:49пожаловаться #2

АГ

Артём Глазунов... in Machine learning

Привет, разобрался? я что-то в ступоре =/

Тут нужно вспомнить определение доверительного интервала, центральную предельную теорему и тот факт, что стандартная ошибка распределения средних равна сигма исходной выборки разделить на корень из размера выборки.

источник

10:12пожаловаться #3

A

Antonina in Machine learning

Артём Глазунов

Тут нужно вспомнить определение доверительного интервала, центральную предельную теорему и тот факт, что стандартная ошибка распределения средних равна сигма исходной выборки разделить на корень из размера выборки.

Спасибо!

источник

10:32пожаловаться #4

V

Valery in Machine learning

Sergey Salnikov

ну да, пространственно - социальные связи, в цвете - интересы

источник

11:52пожаловаться #5

V

Valery in Machine learning

Так?)

источник

11:52пожаловаться #6

❌B

❌Alexander Borokhov... in Machine learning

Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий). Может быть кто-то занимался подобным?

источник

12:05пожаловаться #7

AK

Andrey Korzhun in Machine learning

❌Alexander Borokhov

Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий). Может быть кто-то занимался подобным?

Может CatBoost попробовать?

У них хорошо с текстовыми категориями и пример есть:
https://github.com/catboost/tutorials/tree/master/text_features

catboost/tutorials

CatBoost tutorials repository. Contribute to catboost/tutorials development by creating an account on GitHub.

источник

12:23пожаловаться #8

АГ

Артём Глазунов... in Machine learning

❌Alexander Borokhov

Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий). Может быть кто-то занимался подобным?

А просто очистить, лемматизацию провести (к начальной форме), токенизацию, мешок слов(или без него попробовать, просто номер позиции токена в словаре) , получится последовательность чисел, которую можно кластеризовать kmeans или агломеративной? Ну или попробовать трансфер лернинг с рекуррентными сетями, тем более, что уже частично готово, но сначала подключить эмбеддинги предобученные(векторные представления слов, их надо поискать для русского), раз данных мало...

источник

12:29пожаловаться #9

АГ

Артём Глазунов... in Machine learning

Можно также попробовать тематическую модель построить lda с помощью gensim, но в таком случае темы (кластеры) могут пересекаться.

источник

12:31пожаловаться #10

DD

DS DS in Machine learning

Victoria Buldakova

Всем привет)
У меня тут возник несколько глупый вопрос: в #C2W1 строю прямые, вроде всё похоже на правду. Но очень мне не нравится, что сетка (если ее отображать) поверх всего строится. От чего этого может зависеть?

Гугл выдает что-то о смене значения zorder, но в большинстве случаев кажется, что сетка стандартно отображается фоном и непонятно что именно может на это дело влиять.

это не от темы ли зависит, а то у меня в кастом не отображается сетка

источник

12:38пожаловаться #11

AM

Anastasiia Murashova in Machine learning

Здравствуйте, проверьте пожалуйста c1w4
https://www.coursera.org/learn/mathematics-and-python/peer/4vN1n/tsientral-naia-priediel-naia-tieoriema-svoimi-rukami/review/W5zAtiQIEeuNFA5GHQbb8Q

Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera

Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Specializations, & MOOCs in data science, computer science, business, and dozens of other topics.

источник

13:27пожаловаться #12

AG

Aleksey Gulevsky in Machine learning

Всем привет. В C2W3 есть такая функция def calculate_means(numeric_data):
means = np.zeros(numeric_data.shape[1])
for j in range(numeric_data.shape[1]):
to_sum = numeric_data.iloc[:,j]
indices = np.nonzero(~numeric_data.iloc[:,j].isnull())[0]
correction = np.amax(to_sum[indices])
to_sum /= correction
for i in indices:
means[j] += to_sum[i]
means[j] /= indices.size
means[j] *= correction
return pd.Series(means, numeric_data.columns)

источник

15:11пожаловаться #13

AG

Aleksey Gulevsky in Machine learning

Может кто-нибудь объяснить смысл танцев с корректировкой?

источник

15:12пожаловаться #14

АГ

Артём Глазунов... in Machine learning

❌Alexander Borokhov

Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий). Может быть кто-то занимался подобным?

Кстати, ради интереса, можно посимвольно закодировать( привести к нижнему регистру, собрать словарь символов в коллекции, заменить символ на его номер, сделать вектор таких номеров для каждой записи), после сделать обычный kmeans, подобрав число кластеров по силуэту или elbow rule. Может сработать, и мудрить не надо будет

источник

15:34пожаловаться #15

AB

Alex B in Machine learning

Всем привет! Есть, кто разбирается в styleGAN ?

источник

15:36пожаловаться #16

Д

Динара in Machine learning

подскажите как с таргета вытащить значение 1, например я делаю так у меня не выходит
y = df['Class']
p = y[1] / len(y)

источник

16:07пожаловаться #17

Д

Динара in Machine learning

мне нужно посчитать вероятность

источник

16:07пожаловаться #18

Д

Динара in Machine learning

я знаю что можно через цикл, а как можно через numpy?

источник

16:10пожаловаться #19

IR

Ilkin Ramazanov in Machine learning

Ребят всем привет. Хотел спросить реально ли найти удаленную работу на позицию джуниор мл дев?

источник

16:11пожаловаться #20