Size: a a a

Machine learning

2020 May 08

K

Kirill in Machine learning
Ребята, у меня возникли вопросы по следующей задаче. Буду благодарен, если кто-нибудь сможет прокомменатировать.

Задание: Давайте рассмотрим всех пользователей из контрольной группы (treatment = 1). Для таких пользователей мы хотим проверить гипотезу о том, что штат абонента не влияет на то, перестанет ли абонент пользоваться услугами оператора.
Для этого мы воспользуемся критерием хи-квадрат. Постройте таблицы сопряженности между каждой из всех 1275 возможных неупорядоченных пар штатов и значением признака churn. Для каждой такой таблицы 2x2 применить критерий хи-квадрат

Вопросы:
– Хи-квадрат нужен для проверки, что наша выборка имеет нужное распредление. Как мы это проверяем в данной задаче? Распределение людей по штатам, которые останутся и которые отпишутся от услуг, должно совпадать?
– почему хи-квадрат считается для таблицы 2х2?
источник

Ю

Юрий in Machine learning
Aroh
Это напоминает то что надо было сделать на первом курсе с анализом текстов, но сформулировано так что я как-то прям не уверен
Это про 3 курс, 4 неделя. Не указал тегом, потому-что с заданиями проблем нет. Тематическое моделирование, где мы матрицу частот слов раскладываем в две матрицы тем-слов и тем-документов.

Это просьба помочь с пониманием теории, а не с практикой.

Предлагаемые библиотеки работают, там все просто. Но как именно они делают то, что я спрашиваю - непонятно. В лекциях (и в целом при беглом гуглении) есть объяснение как разложить коллекцию на матрицы, но в прозрачном виде не показано, как применить результаты разложения для определения тем нового документа, которого не было в коллекции при разложении.
источник

K

Kirill in Machine learning
и оффтоп вопрос - кто-нибудь пользуется тулзами для поиска по ноутбукам? Для альфреда под макос ничего не нашёл
источник

I

Ibp in Machine learning
Kirill
Ребята, у меня возникли вопросы по следующей задаче. Буду благодарен, если кто-нибудь сможет прокомменатировать.

Задание: Давайте рассмотрим всех пользователей из контрольной группы (treatment = 1). Для таких пользователей мы хотим проверить гипотезу о том, что штат абонента не влияет на то, перестанет ли абонент пользоваться услугами оператора.
Для этого мы воспользуемся критерием хи-квадрат. Постройте таблицы сопряженности между каждой из всех 1275 возможных неупорядоченных пар штатов и значением признака churn. Для каждой такой таблицы 2x2 применить критерий хи-квадрат

Вопросы:
– Хи-квадрат нужен для проверки, что наша выборка имеет нужное распредление. Как мы это проверяем в данной задаче? Распределение людей по штатам, которые останутся и которые отпишутся от услуг, должно совпадать?
– почему хи-квадрат считается для таблицы 2х2?
1. в данном случае хи_критерий проверяет насколько одинаково отношение отписавшихся пользователей к неотписавшихся с учетом размера выборки для двух штатов 2. 2 на 2 потому что попарно проверяются каждые из штатов: типа в одной колонке - 0 - или false (отписавшиеся),  а в другой 1 - true (неотписавшиеся) . просто для двух признаков (в данном случае штатов) это можно проверить тестом метьюса, вроде. как то так
источник

K

Kirill in Machine learning
Ibp
1. в данном случае хи_критерий проверяет насколько одинаково отношение отписавшихся пользователей к неотписавшихся с учетом размера выборки для двух штатов 2. 2 на 2 потому что попарно проверяются каждые из штатов: типа в одной колонке - 0 - или false (отписавшиеся),  а в другой 1 - true (неотписавшиеся) . просто для двух признаков (в данном случае штатов) это можно проверить тестом метьюса, вроде. как то так
Благодарю за комментарий.

2. Понимаю, что и как проверяется. Не пойму, почему именно так. Зачем попарно проверять штаты? Разве нельзя проверить сразу все?
источник

I

Ibp in Machine learning
Kirill
и оффтоп вопрос - кто-нибудь пользуется тулзами для поиска по ноутбукам? Для альфреда под макос ничего не нашёл
мой вам совет: интересующие вас куски кода, а также скриншоты лекций, лепите в evernote. В Evernoteвсе мгновенно ищется, и он умеет в том числе поиск по тексту на фотографиях реализовать
источник

I

Ibp in Machine learning
Kirill
Благодарю за комментарий.

2. Понимаю, что и как проверяется. Не пойму, почему именно так. Зачем попарно проверять штаты? Разве нельзя проверить сразу все?
ну он и так это все для всех сразу делает, по умолчанию, просто тут в описании написано, КАК он это делает. а одиночная таблица 2 на 2 рассчитывается мэтьюсом.
источник

AK

Alex K in Machine learning
Друзья, добрый день! Помогите, пожалуйста, с отправкой задания за 2ю неделю вводного курса. Задача - загрузить файл с двумя цифрами, разделенными пробелом. Но система на любую попытку загрузить файл выдает 'Не отправлено'. Служба поддержки coursera пишет, что на их стороне технических проблем нет. Чистка кэша, vpn - все без толку. В чем может быть дело?
источник

AK

Alex K in Machine learning
источник

IK

Ivan Krokhalyov in Machine learning
нажми кнопку отправить снизу
источник

N

Norx in Machine learning
The Best Deep Learning Papers from the ICLR 2020 Conference

https://neptune.ai/blog/iclr-2020-deep-learning
источник

AK

Alex K in Machine learning
Ivan Krokhalyov
нажми кнопку отправить снизу
Спасибо огромное!
источник

A

Alexey in Machine learning
Kirill
Благодарю за комментарий.

2. Понимаю, что и как проверяется. Не пойму, почему именно так. Зачем попарно проверять штаты? Разве нельзя проверить сразу все?
Могу посоветовать вторую часть статистики Карпова на степике, там про таблицы сопряж и хи квадрат подробно в начале.
источник

K

Kirill in Machine learning
Alexey
Могу посоветовать вторую часть статистики Карпова на степике, там про таблицы сопряж и хи квадрат подробно в начале.
👍
источник

A

Alexey in Machine learning
Я бы сказал , что мы считаем хи между двумя выборками(есть воздействие, нет воздействия) а потом по хи с заданным уровнем свобод определяем пи вэлью и дальше отклоняем или нет нулевую гипотезу...
источник

PK

Purity Knight in Machine learning
источник

PK

Purity Knight in Machine learning
Кто нибудь может подсказать, в чем проблема?
источник

К

Клим in Machine learning
Ни в чем
источник

К

Клим in Machine learning
Вставь ссылку в браузер
источник

PK

Purity Knight in Machine learning
Действительно
источник