Size: a a a

Python для анализа данных

2021 June 12

АР

Александр Райков... in Python для анализа данных
в принципе, дисперсионный достаточно устойчив к ненормальности данных, но тут трудно что-то заранее сказать. Зависит от степени нарушения, а главное - от нарушенности и других требований к данным (сферичность, равенство дисперсий...)
источник

АР

Александр Райков... in Python для анализа данных
GEE все равно по сути и является аналогом дисперсионного анализа на случай заведомо ненормальной, но известной формы распределения
источник

K

Katerinka in Python для анализа данных
Ок, буду разбираться. Всем спасибо за оживленную беседу и советы!
источник

AC

Andrey Chankin in Python для анализа данных
а почему нельзя провести ANOVA в таком формате: даете n-людей один из препаратов, для каждого осложнения считаете их кол-во, потом проводите ANOVA для каждого осложнения и получаете стат. значимое ли влияние препарата на осложнение?
источник

АР

Александр Райков... in Python для анализа данных
1) Физически можно, но девушка выше написала, что распределение скошено. У дисперсионного в допущениях нормальное распределение отклика. Дальше зависит от того, насколько скошенное по сравнению с нормальным. Я написал, что есть вариант плюнуть и надеяться на устойчивость анализа
2) В любом случае надо сначала проверить значимость взаимодействия факторов препарата и осложнения, а потом уже спускаться на уровень отдельных осложнений. Если взаимодействия нет, а препарат значим, то просто какие-то препараты вызывают больше осложнений (любого типа) в целом, чем другие.
Спускаться сразу к частному обычно чревато проблемами типа "не видеть леса за деревьями" и в статистической литературе не рекомендуется.
источник

AC

Andrey Chankin in Python для анализа данных
понял, спасибо! что-то я упустил сообщение про скошенное распределение)
источник

АР

Александр Райков... in Python для анализа данных
ну скажем так, если асимметрия и эксцесс в пределах плюс-минус два по модулю - наверняка ничего страшного не будет. Если там асимметрия +100500 - дисперсионный можно сломать.
источник

АР

Александр Райков... in Python для анализа данных
мерзость ещё в том, что у ANOVA нормальность - не единственное допущение. И насколько проблематично нарушить именно нормальность - малоосмысленный вопрос в отрыве от других нарушений. При комбинации нескольких нарушений результаты могут скакать очень непредсказуемо
источник

AC

Andrey Chankin in Python для анализа данных
хотя осложнения, скорее, редкий случай, поэтому что-то типа Пуассона должно быть
источник

АР

Александр Райков... in Python для анализа данных
угу. Вот в GEE есть Пуассон как вариант распределения отклика. По крайней мере, в SPSS) Есть ли вообще GEE в Питоне - вопрос точно не ко мне)
источник

AC

Andrey Chankin in Python для анализа данных
ну да, в плане стат тестов, в питоне далеко не все есть, в отличие от R, например
источник
2021 June 13

AK

Anup Kuplu in Python для анализа данных
🔥
источник

AK

Anup Kuplu in Python для анализа данных
источник
2021 June 14

B

Balam in Python для анализа данных
Переслано от Balam
I made over $6000 in 72hours, you should try him out, he's legit and reliable if you are interested in trading contact the company via the link below for more information on how to get started👇👇👇
https://t.me/joinchat/WzfmgE1ZODVjMmU0
источник

AO

Andrey Ostrovsky in Python для анализа данных
источник

ОН

Олег Новиков... in Python для анализа данных
Приветствую всех.
Понемногу вкатываюсь в Пандас, изучая его методом тыка 😊 Но пока не нашел ответ на вопрос, можно ли сделать определенное преобразование, средствами Пандаса.
Суть преобразования -  допустим есть плательщик, у которого есть 3 платежа - по одному в каждом месяце (январь, февраль и март). Сейчас - это 3 строчки в таблице. А нужно сделать так, чтобы была только одна строчка, где указан этот плательщик и добавились ещё 3 столбца (январь, февраль и март), в которых бы были записаны соответствующие суммы.
На скринах ниже наглядная иллюстрация что есть, и к чему нужно прийти
источник

ОН

Олег Новиков... in Python для анализа данных
источник

ОН

Олег Новиков... in Python для анализа данных
источник

ОН

Олег Новиков... in Python для анализа данных
Буду благодарен за дельные советы 😊
источник

ВК

Владимир Калинин... in Python для анализа данных
это преобразование long to wide
источник