Size: a a a

Machine learning

2020 November 11

A

Antonina in Machine learning
Виталий
Привет)
Никак не могу разобраться с вопросом в тесте C4W1. При сигма =1, какой нужен объём выборки, чтобы на уровне доверия 95% оценить среднее с точностью 0.1.
Объясните, пожалуйста, что к чему
Привет, разобрался? я что-то в ступоре =/
источник

dg

ds gtd in Machine learning
Здравствуйте! Где можно следить за анонсами курсов от МФТИ? В начале опроса ввел некорректный адрес, не хочу пропускать
Спасибо!
источник

АГ

Артём Глазунов... in Machine learning
Antonina
Привет, разобрался? я что-то в ступоре =/
Тут нужно вспомнить определение доверительного интервала, центральную предельную теорему и тот факт, что стандартная ошибка распределения средних равна сигма исходной выборки разделить на корень из размера выборки.
источник

A

Antonina in Machine learning
Артём Глазунов
Тут нужно вспомнить определение доверительного интервала, центральную предельную теорему и тот факт, что стандартная ошибка распределения средних равна сигма исходной выборки разделить на корень из размера выборки.
Спасибо!
источник

V

Valery in Machine learning
Sergey Salnikov
ну да, пространственно - социальные связи, в цвете - интересы
источник

V

Valery in Machine learning
Так?)
источник

❌B

❌Alexander Borokhov... in Machine learning
Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить  LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий).  Может быть кто-то занимался подобным?
источник

AK

Andrey Korzhun in Machine learning
❌Alexander Borokhov
Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить  LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий).  Может быть кто-то занимался подобным?
Может CatBoost попробовать?

У них хорошо с текстовыми категориями и пример есть:
https://github.com/catboost/tutorials/tree/master/text_features
источник

АГ

Артём Глазунов... in Machine learning
❌Alexander Borokhov
Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить  LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий).  Может быть кто-то занимался подобным?
А просто очистить, лемматизацию провести (к начальной форме), токенизацию, мешок слов(или без него попробовать, просто номер позиции токена в словаре) , получится последовательность чисел, которую можно кластеризовать kmeans или агломеративной? Ну или попробовать трансфер лернинг с рекуррентными сетями, тем более, что уже частично готово, но сначала подключить эмбеддинги предобученные(векторные представления слов, их надо поискать для русского), раз данных мало...
источник

АГ

Артём Глазунов... in Machine learning
Можно также попробовать тематическую модель построить lda с помощью gensim, но в таком случае темы (кластеры) могут пересекаться.
источник

DD

DS DS in Machine learning
Victoria Buldakova
Всем привет)
У меня тут возник несколько глупый вопрос: в #C2W1 строю прямые, вроде всё похоже на правду. Но очень мне не нравится, что сетка (если ее отображать) поверх всего строится. От чего этого может зависеть?

Гугл выдает что-то о смене значения zorder, но в большинстве случаев кажется, что сетка стандартно отображается фоном и непонятно что именно может на это дело влиять.
это не от темы ли зависит, а то у меня в кастом не отображается сетка
источник

AM

Anastasiia Murashova in Machine learning
источник

AG

Aleksey Gulevsky in Machine learning
Всем привет. В C2W3  есть такая функция def calculate_means(numeric_data):
   means = np.zeros(numeric_data.shape[1])
   for j in range(numeric_data.shape[1]):
       to_sum = numeric_data.iloc[:,j]
       indices = np.nonzero(~numeric_data.iloc[:,j].isnull())[0]
       correction = np.amax(to_sum[indices])
       to_sum /= correction
       for i in indices:
           means[j] += to_sum[i]
       means[j] /= indices.size
       means[j] *= correction
   return pd.Series(means, numeric_data.columns)
источник

AG

Aleksey Gulevsky in Machine learning
Может кто-нибудь объяснить смысл танцев с корректировкой?
источник

АГ

Артём Глазунов... in Machine learning
❌Alexander Borokhov
Добрый день, кто-нибудь сталкивался с задачей классификации тмц? Т.е все новые тмц, например "Батарейка алкал.АА LR6 1,5В" относить к конкретной категории, которая уже есть "Батарейка"? С одной стороны эта задача похожа на классификацию текстов (уже пробовал строить  LSTM, сверточную и GRU), но проблема что данных для обучения практически нет (пока что 1500 записей и 400 категорий).  Может быть кто-то занимался подобным?
Кстати, ради интереса, можно посимвольно закодировать( привести к нижнему регистру, собрать словарь символов в коллекции, заменить символ на его номер, сделать вектор таких номеров для каждой записи), после сделать обычный kmeans, подобрав число кластеров по силуэту или elbow rule. Может сработать, и мудрить не надо будет
источник

AB

Alex B in Machine learning
Всем привет! Есть, кто разбирается в styleGAN ?
источник

Д

Динара in Machine learning
подскажите как с таргета вытащить значение 1, например я делаю так у меня не выходит
y = df['Class']
   p = y[1] / len(y)
источник

Д

Динара in Machine learning
мне нужно посчитать вероятность
источник

Д

Динара in Machine learning
я знаю что можно через цикл, а как можно через numpy?
источник

IR

Ilkin Ramazanov in Machine learning
Ребят всем привет. Хотел спросить реально ли найти удаленную работу на позицию джуниор мл дев?
источник