Size: a a a

Machine learning

2020 November 24

Ю

Юрий in Machine learning
🦅
Добрый день, у меня вопрос. Можно ли использовать ЦПТ на маленьком наборе данных(несколько тысяч)?
Несколько тысяч, это уже не такой и маленький набор, но вообще сильно зависит от исходного распределения. Всякие скошенные распределения требуют больше данных, чтоб их средние начали сходится к нормальному.
источник

Ю

Юрий in Machine learning
🦅
Добрый день, у меня вопрос. Можно ли использовать ЦПТ на маленьком наборе данных(несколько тысяч)?
Попробуйте, например, бутстрапнуть вышу выборку и посмотреть как будут распределены средние полученных подвыборок
источник

🦅

🦅 in Machine learning
Юрий
Несколько тысяч, это уже не такой и маленький набор, но вообще сильно зависит от исходного распределения. Всякие скошенные распределения требуют больше данных, чтоб их средние начали сходится к нормальному.
источник

🦅

🦅 in Machine learning
хистограмма данных выглядит подобным образом
источник

🦅

🦅 in Machine learning
пара тысяч, если быть точным
источник

Ю

Юрий in Machine learning
Понял, все очень косо, но и данных у Вас немало. Попробуйте при помощи бутстрапа исследовать. Насобирайте подвыборок и постройте распределение их средних, а еще лучше просто проверьте гипотезу о их нормальности
источник

🦅

🦅 in Machine learning
Юрий
Понял, все очень косо, но и данных у Вас немало. Попробуйте при помощи бутстрапа исследовать. Насобирайте подвыборок и постройте распределение их средних, а еще лучше просто проверьте гипотезу о их нормальности
1000 выборок размера 200
источник

🦅

🦅 in Machine learning
Юрий
Понял, все очень косо, но и данных у Вас немало. Попробуйте при помощи бутстрапа исследовать. Насобирайте подвыборок и постройте распределение их средних, а еще лучше просто проверьте гипотезу о их нормальности
как можно проверить, можете подсказать, буду очень благодарен
источник

Ю

Юрий in Machine learning
Почему размера 200? Надо бы брать подвыборки размера Вашей исходной выборки, с повторениями
источник

🦅

🦅 in Machine learning
Юрий
Почему размера 200? Надо бы брать подвыборки размера Вашей исходной выборки, с повторениями
спасибо, совсем забыл, еще раз пройдусь по цпт
источник

Ю

Юрий in Machine learning
🦅
спасибо, совсем забыл, еще раз пройдусь по цпт
Это не про ЦПТ, а про бутстрап, то есть мы пытаемся численно получить приближение искомого распределения, а распределение у Вас получается из средних из 2000, а не 200
источник

Ю

Юрий in Machine learning
🦅
как можно проверить, можете подсказать, буду очень благодарен
источник

🦅

🦅 in Machine learning
Юрий
Это не про ЦПТ, а про бутстрап, то есть мы пытаемся численно получить приближение искомого распределения, а распределение у Вас получается из средних из 2000, а не 200
большое спасибо! сейчас посмотрю
источник

i

igor in Machine learning
🦅
Добрый день, у меня вопрос. Можно ли использовать ЦПТ на маленьком наборе данных(несколько тысяч)?
Что значит использовать цпт? Как именно?
источник

Ю

Юрий in Machine learning
igor
Что значит использовать цпт? Как именно?
Видимо предполагать, что среднее выборки будет нормально распределено
источник

i

igor in Machine learning
В цпт есть условия элементы выборки независимы плюс существование моментов
источник

Ю

Юрий in Machine learning
igor
В цпт есть условия элементы выборки независимы плюс существование моментов
И что? 1. Как это мешает ее использовать? 2. Что там про моменты? Классическая формулировка требует только независимости и одинаковости распределения
источник

MN

Maxim Neronov in Machine learning
Юрий
И что? 1. Как это мешает ее использовать? 2. Что там про моменты? Классическая формулировка требует только независимости и одинаковости распределения
Про моменты всё правильно сказано, математическое ожидание и дисперсия должны существовать и быть конечными
источник

Ю

Юрий in Machine learning
Аааа, да, про моменты признаю, ошибся
источник

i

igor in Machine learning
Юрий
И что? 1. Как это мешает ее использовать? 2. Что там про моменты? Классическая формулировка требует только независимости и одинаковости распределения
А если есть зависимость но она слабая и выполняются условия леммы лиденберга феллера
источник