Телеграмм чат группы datasciencecourse страница 3408

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

6404 membersпожаловаться на группу

2020 May 28

K

K-S in Machine learning

Или dummy. Я так и не понял это одно и тоже или разное )

По сути и там, и там кодирование категориального признака происходит через создание бинарных признаков. По уму, конечно, такое кодирование всегда должно предполагать создание n-1 бинарных признаков, где n — кол-во категорий. Это нужно для того, чтобы в данных не появлялась строгая мультиколлинеарность.

На практике же чистые линейные модели используют редко, как правило всегда навешивается сверху регуляризация, которая в свою очередь убирает эффект неединственности оценок, который наступает в случае этой самой строгой мультиколлинеарности, и поэтому на n-1 признаков, грубо говоря, забивают и вводят n бинарных. Хотя это, конечно, некрасивый подход

источник

21:34пожаловаться #1

AT

Anastasiia Tolstokor... in Machine learning

а еще вопрос, если у меня все признаки в датасете бинарные, то есть диапазон от 0 до 1, кроме одного, то разумно ведь сделать нормализацию минимакс только одного признака?

источник

21:55пожаловаться #2

AT

Anastasiia Tolstokor... in Machine learning

или это неважно, и лучше стандартизацию?

источник

21:55пожаловаться #3

K

K-S in Machine learning

Anastasiia Tolstokorova

а еще вопрос, если у меня все признаки в датасете бинарные, то есть диапазон от 0 до 1, кроме одного, то разумно ведь сделать нормализацию минимакс только одного признака?

Да, вполне

источник

22:01пожаловаться #4

I

Ibp in Machine learning

зависит еще от модели, если xgboost, например, то не надо

источник

22:03пожаловаться #5

AT

Anastasiia Tolstokor... in Machine learning

спасибо

источник

22:05пожаловаться #6

A

Aroh in Machine learning

По сути и там, и там кодирование категориального признака происходит через создание бинарных признаков. По уму, конечно, такое кодирование всегда должно предполагать создание n-1 бинарных признаков, где n — кол-во категорий. Это нужно для того, чтобы в данных не появлялась строгая мультиколлинеарность.

На практике же чистые линейные модели используют редко, как правило всегда навешивается сверху регуляризация, которая в свою очередь убирает эффект неединственности оценок, который наступает в случае этой самой строгой мультиколлинеарности, и поэтому на n-1 признаков, грубо говоря, забивают и вводят n бинарных. Хотя это, конечно, некрасивый подход

Почему возникает мультиколлениарность, если новых признаков столько же, сколько категорий?

источник

22:19пожаловаться #7

K

K-S in Machine learning

Почему возникает мультиколлениарность, если новых признаков столько же, сколько категорий?

Потому что сумма этих признаков всегда будет равна константному единичному признаку

источник

22:20пожаловаться #8

I

Ibp in Machine learning

так вроде w*(x..+xn)=w*1, если все категории учтены, у нас же (x..+xn) - это некая матрица. ?

источник

22:30пожаловаться #9

K

K-S in Machine learning

Не понял. У вас же n новых признаков будет, соответственно и n новых весов

источник

22:38пожаловаться #10

I

Ibp in Machine learning

ну в модели идет сложение (w1*x1+w2*x2..+wn*xn)=w(x1+x2+..xn)=w*1/ так вроде, если x-nый в скобках равен либо единице либо нулю в каждой строчке?

источник

22:45пожаловаться #11

K

K-S in Machine learning

Представьте матрицу объекты-признаки X, где по столбцам у нас наши признаки. Первым идёт константный единичный признак. Если вы введёте n бинарных признаков на n категорий, то вы получите систему линейно зависимых векторов, то есть строгую мультиколлинеарность

источник

22:48пожаловаться #12

P

Pierre in Machine learning

Друзья. Подскажите пару идей, как монетизировать знания (краткосрочно, и за сравнительно небольшие деньги)
Закончил 3 курса специализации, теперь самостоятельно копаю в сверточные сети

источник

22:51пожаловаться #13

I

Ibp in Machine learning

ну так это тоже самое только другим языком, я просто отталкивался от того что константного ед. признака нет

источник

22:51пожаловаться #14

K

K-S in Machine learning

Ibp

ну так это тоже самое только другим языком, я просто отталкивался от того что константного ед. признака нет

Но ведь он есть)

источник

22:52пожаловаться #15

I

Ibp in Machine learning

ну почему он есть, это от хозяина зависит:))

источник

22:52пожаловаться #16

AT

Anastasiia Tolstokor... in Machine learning

Ibp

ну в модели идет сложение (w1*x1+w2*x2..+wn*xn)=w(x1+x2+..xn)=w*1/ так вроде, если x-nый в скобках равен либо единице либо нулю в каждой строчке?

а как у вас получилось вынести w за скобки?
по идее ж при каждом х веса разные

источник

22:54пожаловаться #17

K

K-S in Machine learning

Ibp

ну почему он есть, это от хозяина зависит:))

Да он всегда есть, если в модели есть свободный член w.

источник

22:55пожаловаться #18

I

Ibp in Machine learning

Anastasiia Tolstokorova

а как у вас получилось вынести w за скобки?
по идее ж при каждом х веса разные

видимо при таком раскладе все w-nые будут равны w, так видимо

источник

22:56пожаловаться #19

I

Ibp in Machine learning

Да он всегда есть, если в модели есть свободный член w.

ну так я и говорю, от хозяина модели зависит, ввел он его или нет, в некоторых случаях он может априори, например, равен нулю

источник

22:58пожаловаться #20