Телеграмм чат группы datasciencecourse страница 3462

Здесь нужен массив нулей np. zeros(), а предложения превратить в массивы с помощью split(). Количество вхождений слова в массив count(). Также понадобится словарь dict, куда слова будут записываться в ключи для удобства поиска потом. Вроде d это размерность этого словаря, а точнее массива уникальных ключей словаря .keys() . Весь процесс представляет собой превращение предложений в векторы(строки с частотами) , чтобы находить расстояния между ними.

а зачем создавать нулевой массив? разве нельзя создать пустой а затем в него добавлять?

источник

17:10пожаловаться #11

A

Aroh in Machine learning

можно

источник

17:11пожаловаться #12

L

Lieutenant Dan in Machine learning

Кстати, вопрос по поводу массивов от numpy: как их можно вставить в DataFrame? Массив numpy представляет собой array[[0,0,0]], а DataFrame принимает только [0,0,0].

источник

17:18пожаловаться #13

АГ

Артём Глазунов... in Machine learning

источник

17:24пожаловаться #14

A

Adilet in Machine learning

Lieutenant Dan

Кстати, вопрос по поводу массивов от numpy: как их можно вставить в DataFrame? Массив numpy представляет собой array[[0,0,0]], а DataFrame принимает только [0,0,0].

Reshape

источник

17:26пожаловаться #15

PK

Pavel Kozlov in Machine learning

Alex Ololo

всем привет. повторюсь с вопросом.

подскажите. часто используют логарифимирование зависимой переменой . например в задачах регрессиии.
Я правильно понимаю - что это делается в целях сделать модель более линейной для того что бы mse лучше работало?
и если да, то данная операция бесполезна если я буду использовать деревья и бустинг над ними - он ок и не с линейными моделямя работают? я прав?

https://www.youtube.com/watch?v=J6NwmeAB8Gg

YouTube

Интерпретация коэффициента при логарифмировании в уравнениях регрессии

Одним из частых преобразований при построении модели является логарифмирование. Зачем логарифмируют переменные? Иногда логарифмируют объясняющую переменную, ...

источник

17:27пожаловаться #16

A

Adilet in Machine learning

Если в дф размерность у Вас 3*1, то привести (3,)

источник

17:28пожаловаться #17

AR

Anton Rogozin in Machine learning

Olga Gonch

Какие есть альтернативы современные. У меня пару сотен диалогов, нужно разбить их на 10, 15, 20 тем

Что-то сразу в голову не пришло. Если выборка с текстами не размечена, то кроме bigartm, можно использовать TfidfVectorizer с любым методом кластеризации данных. И визуализировать с помощью t-sne, чтобы понять, хорошо ли кластеризовалось

источник

17:29пожаловаться #18

A

Alexey in Machine learning

Pavel Kozlov

https://www.youtube.com/watch?v=J6NwmeAB8Gg

YouTube

Интерпретация коэффициента при логарифмировании в уравнениях регрессии

Одним из частых преобразований при построении модели является логарифмирование. Зачем логарифмируют переменные? Иногда логарифмируют объясняющую переменную, ...

Очень хороший препод. Когда на курсе непонятно (почти всегда ))) смотрю его

источник

17:30пожаловаться #19