K
Задание: Давайте рассмотрим всех пользователей из контрольной группы (treatment = 1). Для таких пользователей мы хотим проверить гипотезу о том, что штат абонента не влияет на то, перестанет ли абонент пользоваться услугами оператора.
Для этого мы воспользуемся критерием хи-квадрат. Постройте таблицы сопряженности между каждой из всех 1275 возможных неупорядоченных пар штатов и значением признака churn. Для каждой такой таблицы 2x2 применить критерий хи-квадрат
Вопросы:
– Хи-квадрат нужен для проверки, что наша выборка имеет нужное распредление. Как мы это проверяем в данной задаче? Распределение людей по штатам, которые останутся и которые отпишутся от услуг, должно совпадать?
– почему хи-квадрат считается для таблицы 2х2?