Телеграмм чат группы datasciencecourse страница 3340

У sklearn есть много разных метрик, которыми можно измерить качество кластеризации. Можно попробовать измерить разные метрики на разных K и посмотреть что дает лучший результат.
Некоторые из этих метрик совместимы с методом локтя

https://scikit-learn.org/stable/modules/model_evaluation.html

источник

11:31пожаловаться #3

n

novicer in Machine learning

+ я взял кластеризацию c-means из-за того, что у меня есть категориальные данные, но при этом я не могу определить вес каждого параметра -> с этим у локтя тоже проблемы должны быть

источник

11:32пожаловаться #4

n

novicer in Machine learning

Ruslan Sabirov

У sklearn есть много разных метрик, которыми можно измерить качество кластеризации. Можно попробовать измерить разные метрики на разных K и посмотреть что дает лучший результат.
Некоторые из этих метрик совместимы с методом локтя

https://scikit-learn.org/stable/modules/model_evaluation.html

а если у меня нет заранее информации о классах?

источник

11:43пожаловаться #5

RS

Ruslan Sabirov in Machine learning

novicer

а если у меня нет заранее информации о классах?

Там есть и supervised (есть true классы) и non-supervised (нет информации о true классах) метрики. Например, Silhouette score (non-supervised) используют логику того, что точки расположенные рядом должны быть в одном классе, а те, что далеко — в разных

источник

11:46пожаловаться #6

ЕЯ

Евгений Яковлев... in Machine learning

novicer

s = ['a', 'b', 'c']
[" ".join(s)]

спасибо!

источник

11:58пожаловаться #7

n

novicer in Machine learning

Ruslan Sabirov

Там есть и supervised (есть true классы) и non-supervised (нет информации о true классах) метрики. Например, Silhouette score (non-supervised) используют логику того, что точки расположенные рядом должны быть в одном классе, а те, что далеко — в разных

а какую метрику вообще лучше использовать для категориальных данных? cityblock? minkowski + предварительная нормализация? что-то ещё?

источник

12:51пожаловаться #8

ID

Ilya Denisov in Machine learning

Коллеги, столкнулся с проблемой при установке pip
python -m pip install -U pip
выдает, что python не является внутренней или внешней командой....

Подскажите, пожалуйста, как исправить чтобы установка прошла успешно?

источник

13:02пожаловаться #9

FR

Fizuli Ragimov in Machine learning

Разве не python -m pip install -U ? Могу ошибаться

источник

13:04пожаловаться #10

SD

Sergey Dudoladov in Machine learning

Pyhton3 попробуйте

источник

13:05пожаловаться #11

ID

Ilya Denisov in Machine learning

Sergey Dudoladov

Pyhton3 попробуйте

не помогает

источник

13:07пожаловаться #12

VZ

Valeriy Zubairov in Machine learning

Если винда, то надо python в PATH запихать

источник

13:08пожаловаться #13

VZ

Valeriy Zubairov in Machine learning

Потому что он, к сожалению, не всегда сам прокидывается

источник

13:08пожаловаться #14

VZ

Valeriy Zubairov in Machine learning

Либо писать полный путь к питону

источник

13:08пожаловаться #15

VZ

Valeriy Zubairov in Machine learning

То есть не python blaba, а
C:/users/lib/bin и так далее

источник

13:09пожаловаться #16

VZ

Valeriy Zubairov in Machine learning

https://datatofish.com/add-python-to-windows-path/

Datatofish

How to add Python to Windows PATH - Data to Fish

There are few ways in which you can add Python to Windows PATH. In this post, I'll show you two methods that you can use to add Python to Windows path.

источник

13:09пожаловаться #17

ID

Ilya Denisov in Machine learning

Valeriy Zubairov

https://datatofish.com/add-python-to-windows-path/

Datatofish

How to add Python to Windows PATH - Data to Fish

There are few ways in which you can add Python to Windows PATH. In this post, I'll show you two methods that you can use to add Python to Windows path.

спасибо, посмотрю

источник

13:13пожаловаться #18

RS

Ruslan Sabirov in Machine learning

novicer

а какую метрику вообще лучше использовать для категориальных данных? cityblock? minkowski + предварительная нормализация? что-то ещё?

К сожалению, не работал с категориальными данными. Как вариант можно попробовать взять все комбинации категориальных фичей и применить кластеринг для каждой комбинации независимо.

источник

13:34пожаловаться #19

RS

Ruslan Sabirov in Machine learning

Кстати, если есть возможность, можно попробовать вручную разметить датасет и проставить реальные классы для 1-5 тыс примеров, применить на них RandomForestClassifier и посмотреть важность фичей (feature_importance).
Если вдруг окажется, что категориальные фичи не очень важны, то их можно будет отбросить

источник

13:36пожаловаться #20