Size: a a a

2021 March 17

ИП

Иван Поздняков... in Science FYI
Да, именно, это выборки из нормального распределения
источник

M

Mr.britva in Science FYI
Olga Kalinina
Сложно спорить с тем, что одинаковый эффект (скажем, разница средних) на выборках разного размера имеет разную достоверность
Ну он то другое писал, блин. Что сам факт достаточно большой выборки позволяет найти различие. В принципе. Пофиг есть оно там или нет
источник

ИП

Иван Поздняков... in Science FYI
С одинаковым средним
источник

OL

Olga Lebed in Science FYI
Магмантёнок Дима также известный как Антрополог с Марса
И снова огромное спасибо!

Теперь последний вопрос, пока мне это в ближайшее время не пригодится. Когда применяется поправка Бонферрони?
(ответ "при множественных сравнениях" слишком простой, хочу знать суть)
Если вкратце когда много условий которые вы хотите сравнить друг с другом

Например если у вас есть красные улитки и зелёные улитки. Половина красных/зелёных едят яблоки днём и ночью и половина - груши тоже днём ночью
И вы хотите между собой сравнить
Красных с яблоками днём, красных с грушами днём, красных с яблоками ночью итд
источник

M

Mr.britva in Science FYI
Иван Поздняков
С одинаковым средним
А вы что-то писали про то что выборки разные должны быть? Перечитайте свое сообщение))
источник

M

Mr.britva in Science FYI
Иван Поздняков
Просто статистические тесты всегда найдут эффект на больших выборках, на то они и статистические тесты. И при этом как раз нас обычно отклонения от нормальности менее критичны на больших выборках.
Вот
источник

ИП

Иван Поздняков... in Science FYI
Mr.britva
Я ж написал и на скриншот было: rnorm(100000000). Если прямо трактовать ваше утверждение, то пофигу на наличие или отсутствие реальных различий, большая выборка даст возможность найти эффект
Более того, если повторить это много раз, то p-value будет распределен равномерно и примерно в 5% p value будет меньше .05. Это именно то, как должны работать статистические тесты
источник

M

Mr.britva in Science FYI
Иван Поздняков
Более того, если повторить это много раз, то p-value будет распределен равномерно и примерно в 5% p value будет меньше .05. Это именно то, как должны работать статистические тесты
А потом применяется поправка и это сжирается ещё сильнее
источник

OL

Olga Lebed in Science FYI
Olga Lebed
Если вкратце когда много условий которые вы хотите сравнить друг с другом

Например если у вас есть красные улитки и зелёные улитки. Половина красных/зелёных едят яблоки днём и ночью и половина - груши тоже днём ночью
И вы хотите между собой сравнить
Красных с яблоками днём, красных с грушами днём, красных с яблоками ночью итд
По большому счету это та ситуация в которой вы делаете анову/регрессию которая говорит вам что различия где-то тут есть но не говорит где именно.
И тут два варианта:
Либо вы железобетонно проверяете только то что обещали не теряя мощности без поправок (у вас гипотеза про зелёных и красных улиток вот вы только этот контраст и делаете)
Или вы сравниваете все со всем делая поправки и теряя мощность

Недобросовестные люди делают втрое без поправок и подучившиеся выдают за изначальную гипотезу как будто это planned comparison (не надо так)
источник

Мт

Магмантёнок Дима так... in Science FYI
Olga Lebed
Если вкратце когда много условий которые вы хотите сравнить друг с другом

Например если у вас есть красные улитки и зелёные улитки. Половина красных/зелёных едят яблоки днём и ночью и половина - груши тоже днём ночью
И вы хотите между собой сравнить
Красных с яблоками днём, красных с грушами днём, красных с яблоками ночью итд
Понял. Но как выше сказано, поправка на множественное сравнение уже встроена
источник

ИП

Иван Поздняков... in Science FYI
Mr.britva
А вы что-то писали про то что выборки разные должны быть? Перечитайте свое сообщение))
Да, все верно, я имел в виду именно следующее:
1) если эффект есть, пусть даже и маленький, то статистические тесты всегда его найдут, это вопрос мощности -> размера эффекта
2) в природе нормальные распределения практически не встречаются

Значит, при достаточном размере выборки тесты на нормальность всегда будут давать отклонения от нормальности за редкими исключениями (одно из них симулированные данные из нормального распределения)
источник

OL

Olga Lebed in Science FYI
Магмантёнок Дима также известный как Антрополог с Марса
Понял. Но как выше сказано, поправка на множественное сравнение уже встроена
Да, но если вы добросовестный человек, то вы сравниваете отдельные контрасты т-тестами которые релевантны вашей априори гипотезе и больше не трогаете ничего вообще. В этой ситуации можно не применять поправок и не терять мощности

Или трогаете и честно пишете что это exploratory analysis
источник

M

Mr.britva in Science FYI
Иван Поздняков
Да, все верно, я имел в виду именно следующее:
1) если эффект есть, пусть даже и маленький, то статистические тесты всегда его найдут, это вопрос мощности -> размера эффекта
2) в природе нормальные распределения практически не встречаются

Значит, при достаточном размере выборки тесты на нормальность всегда будут давать отклонения от нормальности за редкими исключениями (одно из них симулированные данные из нормального распределения)
С пунктом вторым бы поспорил. В биомедицинских исследованиях оно встречается редко, в природе - не думаю
источник

Мт

Магмантёнок Дима так... in Science FYI
Иван Поздняков
Да, все верно, я имел в виду именно следующее:
1) если эффект есть, пусть даже и маленький, то статистические тесты всегда его найдут, это вопрос мощности -> размера эффекта
2) в природе нормальные распределения практически не встречаются

Значит, при достаточном размере выборки тесты на нормальность всегда будут давать отклонения от нормальности за редкими исключениями (одно из них симулированные данные из нормального распределения)
2. Не верю, если нарвать пучок травы, то длины травинок будут распределены нормально
источник

ИП

Иван Поздняков... in Science FYI
Магмантёнок Дима также известный как Антрополог с Марса
2. Не верю, если нарвать пучок травы, то длины травинок будут распределены нормально
Я очень далек от ботаники, но...
Допустим. Мы берем разные сорта или один? Если разные, то уже не будет нормальности
источник

Мт

Магмантёнок Дима так... in Science FYI
Иван Поздняков
Я очень далек от ботаники, но...
Допустим. Мы берем разные сорта или один? Если разные, то уже не будет нормальности
Один конечно
источник

ИП

Иван Поздняков... in Science FYI
Идем дальше. Одно время года? Один климат?
источник

ИП

Иван Поздняков... in Science FYI
Нам либо постоянно нужно сужать условия, либо в какой-то момент сказать: окей, мы берем вот эти вот разные условия. И они будут влиять сами сильнее других. И не получится идеально нормального распределения.
источник

om

otter lives matter in Science FYI
Это уже разговор о том, что идеальных объектов в природе не существует.
источник

ИП

Иван Поздняков... in Science FYI
otter lives matter
Это уже разговор о том, что идеальных объектов в природе не существует.
Да, именно. Это довольно очевидная вещь, отсюда и то, что идеальных нормальных распределений в природе не существует
источник