Size: a a a

Machine learning

2020 June 04

Ю

Юрий in Machine learning
Tatiana Uaman
#C3W2 Задание на РСА.  Правильно ли я понимаю, что просто PCA и есть RandomizedPCA в последних версиях библиотеки sklearn?
Все верно.
источник

TU

Tatiana Uaman in Machine learning
Юрий
Все верно.
Отлично, спасибо
источник

A

Alexey in Machine learning
В сиборне scatterplot нельзя уставить , какие точки вверху, какие внизу? Такое впечатление, что забиваются красные верхними синими
источник

A

Alexey in Machine learning
можно через два графика делать - и рисовать один на другом , но хочется в одну строчку
источник

АГ

Артём Глазунов... in Machine learning
Alexey
В сиборне scatterplot нельзя уставить , какие точки вверху, какие внизу? Такое впечатление, что забиваются красные верхними синими
Попробуйте понастраивать прозрачность точек в параметрах, оптимально 0.5 где-то
источник

A

Alexey in Machine learning
это альфа - пробовал, но размыто..
источник

y

yithian in Machine learning
Alexey
В сиборне scatterplot нельзя уставить , какие точки вверху, какие внизу? Такое впечатление, что забиваются красные верхними синими
hue_order.
источник

A

Alexey in Machine learning
гениально ) спасибо
источник

A

Alexey in Machine learning
надо было до конца прочитать документацию, а не долбить гугл запросами в надежде на стэковерфлоу
источник

y

yithian in Machine learning
Да, документация - сила.)
источник

Д

Динара in Machine learning
Артём Глазунов
Здесь нужен массив нулей np. zeros(), а предложения превратить в массивы с помощью split(). Количество вхождений слова в массив count(). Также понадобится словарь dict, куда слова будут записываться в ключи для удобства поиска потом. Вроде d это размерность этого словаря, а точнее массива уникальных ключей словаря .keys() . Весь процесс представляет собой превращение предложений в векторы(строки с частотами) , чтобы находить расстояния между ними.
а зачем создавать нулевой массив? разве нельзя создать пустой а затем в него добавлять?
источник

A

Aroh in Machine learning
можно
источник

L

Lieutenant Dan in Machine learning
Кстати, вопрос по поводу массивов от numpy: как их можно вставить в DataFrame? Массив numpy представляет собой array[[0,0,0]], а DataFrame принимает только [0,0,0].
источник

АГ

Артём Глазунов... in Machine learning
источник

A

Adilet in Machine learning
Lieutenant Dan
Кстати, вопрос по поводу массивов от numpy: как их можно вставить в DataFrame? Массив numpy представляет собой array[[0,0,0]], а DataFrame принимает только [0,0,0].
Reshape
источник

PK

Pavel Kozlov in Machine learning
Alex Ololo
всем привет. повторюсь с вопросом.

подскажите. часто используют логарифимирование зависимой переменой . например в задачах регрессиии.
Я правильно понимаю - что это делается в целях сделать модель более линейной для того что бы mse лучше работало?
и если да, то данная операция бесполезна если я буду использовать деревья и бустинг над ними - он ок и не с линейными моделямя работают? я прав?
источник

A

Adilet in Machine learning
Если в дф размерность у Вас 3*1, то привести (3,)
источник

AR

Anton Rogozin in Machine learning
Olga Gonch
Какие есть альтернативы современные. У меня пару сотен диалогов, нужно разбить их на 10, 15, 20 тем
Что-то сразу в голову не пришло. Если выборка с текстами не размечена, то кроме bigartm, можно использовать TfidfVectorizer с любым методом кластеризации данных. И визуализировать с помощью t-sne, чтобы понять, хорошо ли кластеризовалось
источник

A

Alexey in Machine learning
Очень хороший препод.  Когда на курсе непонятно (почти всегда ))) смотрю его
источник

RS

Ruslan Sabirov in Machine learning
Olga Gonch
Какие есть альтернативы современные. У меня пару сотен диалогов, нужно разбить их на 10, 15, 20 тем
LDA, но он не очень новый
источник