Size: a a a

Machine learning

2020 December 17

V

Valery in Machine learning
Egor
просто по факту у нас 2 кластера просто
причем, я поднимал вопрос, что относить к двум классам: -1 и 0 или 0 и 1 при отнесении -1 к выбросам. В итоге вышло настроить кластеризацию так, что действительно 0 и 1 определялись неплохо
источник

V

Valery in Machine learning
то есть можно дбсканом найти 2 класса: -1 и 0, обернуть -1 в 1 и сказать - вот мои 2 класса
источник

I

Ibp in Machine learning
Valery
поэтому можно))
у каждого класса может быть несколько центров кластеризации
источник

V

Valery in Machine learning
Да, но алги кластеризации настраиваются
источник

V

Valery in Machine learning
Авторы Isolation Kernel’a зачем-то тестились на cancer датасете
источник

I

Ibp in Machine learning
ну я к тому что это не всегда однозначно, в некоторых случаях может и верно а в некоторых наоборот. а ссылку на тот пример можно?
источник

K

K-S in Machine learning
Ibp
у каждого класса может быть несколько центров кластеризации
+++. В том же sklearn.datasets.make_classification, например, даже можно задать кол-во классов и кол-во кластеров, и, разумеется, равняться они не обязаны
источник

K

K-S in Machine learning
А, на скрине все есть
источник

K

K-S in Machine learning
Не сразу глянул
источник

I

Ibp in Machine learning
K-S
+++. В том же sklearn.datasets.make_classification, например, даже можно задать кол-во классов и кол-во кластеров, и, разумеется, равняться они не обязаны
так я тут через мэйк классификэйшн и задал:)
источник

K

K-S in Machine learning
👍🏻
источник

I

Ibp in Machine learning
Valery
Да, но алги кластеризации настраиваются
это хорошо когда у вас классы уже есть, а когда задача unsupervised learning без лейблов, непонятно как понять что 4 кластера это 2 класса, ну или я пока не понимаю
источник

V

Valery in Machine learning
Я согласен
источник
2020 December 18

NO

Nikolai Orlov in Machine learning
Друзья, не подскажете, почему не работает вот такой код?
extra=[]
for key in dictionary2.dfs.keys():
 if dictionary2.dfs[key]>4000:
   extra.append(key)

for i in extra:
 dictionary2.filter_tokens(bad_ids=[dictionary2.token2id[dictionary2[i]]])

Вроде считает, но ответ неверный. Перепроверяешь потом наличие частот больше 4000 - он их снова находит. Хотя должен был уже вычистить.
источник

NO

Nikolai Orlov in Machine learning
Получается, что он находит не все элементы с частотой больше 4000 за один раз. Как такое возможно?
источник

J

Jenny in Machine learning
Подскажите пожалуйста, а крусере все ещё предоставляет сколаршип по специализации?
источник

IM

Irina Makarova in Machine learning
Jenny
Подскажите пожалуйста, а крусере все ещё предоставляет сколаршип по специализации?
Да, вы можете подать заявку на финпомощь, и ее рассмотрят
источник

SB

Stanislav Besedin in Machine learning
Привет dear all. Помогите пож. разобраться с правильным использованием DictVectorizer и OneHotEncoder. Правильно ли я понимаю, что DictVectorizer преобразует в бинарный код те категориальные признаки, которые имеют стринговые значения, в то время как признаки с вещественными значениями остаются неизменными. Таким образом, для того чтобы все признаки преобразовать в бинарный код (для последующего применения в LogisticRegression) надо к датасету последовательно применить DictVectorizer, а затем OneHotEncoder?
источник

GB

George Boole in Machine learning
OH всё сам делает
источник

А

Артем in Machine learning
Stanislav Besedin
Привет dear all. Помогите пож. разобраться с правильным использованием DictVectorizer и OneHotEncoder. Правильно ли я понимаю, что DictVectorizer преобразует в бинарный код те категориальные признаки, которые имеют стринговые значения, в то время как признаки с вещественными значениями остаются неизменными. Таким образом, для того чтобы все признаки преобразовать в бинарный код (для последующего применения в LogisticRegression) надо к датасету последовательно применить DictVectorizer, а затем OneHotEncoder?
DictVectorize работает со словарями и создаёт из него таблицу признаков без меток.

https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.DictVectorizer.html посмотрите пример
источник