Телеграмм чат группы datasciencecourse страница 4323

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7549 membersпожаловаться на группу

2020 November 11

K

K-S in Machine learning

Ibp

а ну я не обратил внимание что распределение задано аналитически, ну тогда просто чтобы лес не городить с формулами можно наплодить достаточно большое количество точек - и вот вам будет распределение заданное выборкой

Не очень понял. Ну пусть у него есть генератор из некоего бимодального распределения. Ну насемплировал он их него миллионы точек, получились сглаженные гауссианы, но как оценить их дисперсию без ем все равно непонятно

источник

19:34пожаловаться #1

I

Ibp in Machine learning

так чтобы все точки допустим вошли в какойто доверительный интервал, допустим 99%

источник

19:34пожаловаться #2

K

K-S in Machine learning

Вот вам гауссовская смесь. Как вы хотите оценить дисперсию каждой из них кроме как через ем алгоритм?

Ну вот, допустим, результат семплирования. Как вы хотите ещё раз тут действовать без ем?

источник

19:35пожаловаться #3

I

Ibp in Machine learning

Не очень понял. Ну пусть у него есть генератор из некоего бимодального распределения. Ну насемплировал он их него миллионы точек, получились сглаженные гауссианы, но как оценить их дисперсию без ем все равно непонятно

ну как, я вижу что там будет два пика или нет? оценить их - это будет среднее. и есть точки слева и справа от пиков - это полуколоколы или как там каждого из распределения

источник

19:36пожаловаться #4

K

K-S in Machine learning

Так их разное количество с каждой стороны, или вы симметрично хотите прикидывать? И как тогда это вы с вычислительной точки зрения хотите делать?

источник

19:37пожаловаться #5

I

Ibp in Machine learning

Так их разное количество с каждой стороны, или вы симметрично хотите прикидывать? И как тогда это вы с вычислительной точки зрения хотите делать?

автор говорит, что оба распределения нормальны и мы ищем параметры для нормальных распределений, для этого нам можно знать тольео то что находится либо слева либо справа от среднего ибо они симметричны

источник

19:44пожаловаться #6

AD

Ai Dana in Machine learning

Всем привет,
„С1W2“
не могу скачать ‘dataset.tsv’, открыла html станицу, скачать не могу.

источник

20:10пожаловаться #7

DP

Dima Petrov in Machine learning

В каком браузере открываешь?

источник

20:19пожаловаться #8

DP

Dima Petrov in Machine learning

Ai Dana

Всем привет,
„С1W2“
не могу скачать ‘dataset.tsv’, открыла html станицу, скачать не могу.

Попробуй в хроме открыть.

источник

20:19пожаловаться #9

AD

Ai Dana in Machine learning

В каком браузере открываешь?

сафари

источник

20:27пожаловаться #10

DP

Dima Petrov in Machine learning

Ai Dana

сафари

В сафари открывает, не скачивает(

источник

20:31пожаловаться #11

MM

Mira Mironova in Machine learning

В сафари открывает, не скачивает(

а пин читали?

источник

20:37пожаловаться #12

AD

Ai Dana in Machine learning

В сафари открывает, не скачивает(

спасибо!

источник

20:41пожаловаться #13

V

Vlad in Machine learning

@rogozinushka смотрел твой FAQ
Материальную помощь можно и на русском подавать
И просто ctrl c / ctrl v
И по несколько за раз
Главное как я понял лимит слов преодолеть

источник

20:50пожаловаться #14

AR

Anton Rogozin in Machine learning

@rogozinushka смотрел твой FAQ
Материальную помощь можно и на русском подавать
И просто ctrl c / ctrl v
И по несколько за раз
Главное как я понял лимит слов преодолеть

Оки, поправил. Спасибо 👍

источник

20:53пожаловаться #15

K

K-S in Machine learning

Ibp

автор говорит, что оба распределения нормальны и мы ищем параметры для нормальных распределений, для этого нам можно знать тольео то что находится либо слева либо справа от среднего ибо они симметричны

Так вы не ответили на вопрос, как вы это численно собрались делать? На глаз определять среднее?

источник

20:54пожаловаться #16

MK

Maria Kulyashova in Machine learning

Добрый вечер!

Подскажите, пожалуйста, есть ли какое-то оптимальное количество значений, которые может принимать категориальная переменная в модели?

Собираюсь строить рэндом форест и бустинг, некоторые категориальные переменные имеют по 10+ значений, насколько я понимаю, это плохо для encoding

(Все это гуглила, везде разная информация, поэтому обращаюсь сюда за советом)

источник

20:54пожаловаться #17

K

K-S in Machine learning

Так вы не ответили на вопрос, как вы это численно собрались делать? На глаз определять среднее?

А если у тс ещё и выборка, а не вся ГС, то все ещё более неоднозначно становится в вашем подходе

источник

20:55пожаловаться #18

АГ

Артём Глазунов... in Machine learning

Ibp

автор говорит, что оба распределения нормальны и мы ищем параметры для нормальных распределений, для этого нам можно знать тольео то что находится либо слева либо справа от среднего ибо они симметричны

У нас же на исходной картинке изображена сумма плотностей от разных гауссиан, моды на графиках - это смещенные средние для гауссиан.

источник

21:01пожаловаться #19

АГ

Артём Глазунов... in Machine learning

Maria Kulyashova

Добрый вечер!

Подскажите, пожалуйста, есть ли какое-то оптимальное количество значений, которые может принимать категориальная переменная в модели?

Собираюсь строить рэндом форест и бустинг, некоторые категориальные переменные имеют по 10+ значений, насколько я понимаю, это плохо для encoding

(Все это гуглила, везде разная информация, поэтому обращаюсь сюда за советом)

Тут вопрос не в оптимальном количестве категорий, а в способах кодирования. Можно ввести гиперпараметр для порогового числа категорий(скажем, 30), для признаков, где меньше, использовать one hot, для остальных ordinal или mean encoding. Этот гиперпараметр подобрать на кросс-валидации. Вообще, для деревьев one hot не рекомендуют, конечно, использовать, но при малом числе категорий все равно его используют.

источник

21:06пожаловаться #20