Size: a a a

Python для анализа данных

2021 March 17

I

Igor in Python для анализа данных
Bogdan Pilyavets
Справедливости ради, доверительный интервал для квантиля вполне себе и без бутстрэпа, и без предположения о распределении популяции строится, потому что количество иксов меньших, чем номер квантиля распределено биномиально
Честно говоря, первый раз об этом слышу и буду рад какому то источнику. Но допустим ты прав - какой параметр p в этого распределения?
источник

I

Igor in Python для анализа данных
Григорий Демин
Если там двадцать точек или около того, то подход с аппроксимацией распределением имеет право на жизнь. Если сотни и тысячи точек, то какой смысл? Все можно рассчитать и проверить без всяких дополнительных предположений
Чем рассчитать?
источник

BP

Bogdan Pilyavets in Python для анализа данных
Igor
Честно говоря, первый раз об этом слышу и буду рад какому то источнику. Но допустим ты прав - какой параметр p в этого распределения?
источник

ГД

Григорий Демин... in Python для анализа данных
Григорий Демин
Если там двадцать точек или около того, то подход с аппроксимацией распределением имеет право на жизнь. Если сотни и тысячи точек, то какой смысл? Все можно рассчитать и проверить без всяких дополнительных предположений
Отвести часть наблюдений под тест и проверить будет ли там 5% людей возвращаться спустя квантиль полученный на основной выборке
источник

ГД

Григорий Демин... in Python для анализа данных
Bogdan Pilyavets
Справедливости ради, доверительный интервал для квантиля вполне себе и без бутстрэпа, и без предположения о распределении популяции строится, потому что количество иксов меньших, чем номер квантиля распределено биномиально
Это на самом деле очень прикольная тема. Например, из этого следует очень простое правило - если есть пять наблюдений, то крайние значения образуют 90% доверительный интервал для медианы. Можно удивлять людей:)
источник

BP

Bogdan Pilyavets in Python для анализа данных
Григорий Демин
Это на самом деле очень прикольная тема. Например, из этого следует очень простое правило - если есть пять наблюдений, то крайние значения образуют 90% доверительный интервал для медианы. Можно удивлять людей:)
даже я вот удивился, хотя сам эту тему и начал😅
источник

I

Igor in Python для анализа данных
@pilyavetsb,  не слышал об этом методе. Спасибо, буду знать)) Порылся ещё немного - есть ещё один похожий метод. Но, если сходится с симуляцией, то тут уже вопрос вкуса. Просто если можно оценить распределение, то лучше, как по мне, это сделать, поскольку это открывает больше возможностей, нежели интервальная оценка наблюдаемого распределения - я об этом изначально писал.
источник

BP

Bogdan Pilyavets in Python для анализа данных
Igor
@pilyavetsb,  не слышал об этом методе. Спасибо, буду знать)) Порылся ещё немного - есть ещё один похожий метод. Но, если сходится с симуляцией, то тут уже вопрос вкуса. Просто если можно оценить распределение, то лучше, как по мне, это сделать, поскольку это открывает больше возможностей, нежели интервальная оценка наблюдаемого распределения - я об этом изначально писал.
С этим не спорю, мой комент исключительно к методам оценки интервалов относился)
источник

I

Igor in Python для анализа данных
Bogdan Pilyavets
С этим не спорю, мой комент исключительно к методам оценки интервалов относился)
Да, и кстати, осознал глупость своего вопроса по поводу параметра p - очевидно же))
источник
2021 March 18

АЗ

Александр Зенков... in Python для анализа данных
коллеги питонисты, подскажите, пожалуйста, как с помощью библиотеки logging записывать появляющиеся ошибки в лог-файл? Как создавать логгер и просто писать в файл я понимаю, но вот как записывать именно выпадающие ошибки, ума не приложу.
Хотелось бы это реализовать без конструкции try-except
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Александр Зенков
коллеги питонисты, подскажите, пожалуйста, как с помощью библиотеки logging записывать появляющиеся ошибки в лог-файл? Как создавать логгер и просто писать в файл я понимаю, но вот как записывать именно выпадающие ошибки, ума не приложу.
Хотелось бы это реализовать без конструкции try-except
Скорее всего никак
источник

АЗ

Александр Зенков... in Python для анализа данных
Pavel Zheltouhov
Скорее всего никак
вроде задача крайне очевидная, но решения нигде нет
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Александр Зенков
вроде задача крайне очевидная, но решения нигде нет
Если ничего не гуглится - люди так не делают. Значит ваше понимание неправильно
источник

T

Tishka17 in Python для анализа данных
Александр Зенков
коллеги питонисты, подскажите, пожалуйста, как с помощью библиотеки logging записывать появляющиеся ошибки в лог-файл? Как создавать логгер и просто писать в файл я понимаю, но вот как записывать именно выпадающие ошибки, ума не приложу.
Хотелось бы это реализовать без конструкции try-except
В случае всяких сервисов есть обычно демон (journald, например), который читает вывод твоего приложения и пишет в хранилище логов. В файлы руками никто не пишет из логгинга. Для десктопных приложений это не так, там проще всего в мейне сделай трай эксепт и записать в лог и потом уже только упасть
источник

PZ

Pavel Zheltouhov in Python для анализа данных
"для остальных приложений не разрабатываемых в гигантском пузыре яндекса" это не так, вы хотели сказать.
источник
2021 March 19

NA

Nastya Alimova in Python для анализа данных
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Однажды Джоел Спольски дал совет программистам : пишите блог даже если никто не читает !
Ох если б он знал к чему это приведет...
источник

I

Igor in Python для анализа данных
Pavel Zheltouhov
Однажды Джоел Спольски дал совет программистам : пишите блог даже если никто не читает !
Ох если б он знал к чему это приведет...
Как и создание интернета для всеобщего просвещения и деления знаниями))
источник

AK

Alex K in Python для анализа данных
Народ, мне надо проверить как prophet предсказывает по моим данным на помледующие два дня, это просто в цикле надо запустить двигая день отсечки? Особенных способов нет?
источник
2021 March 21

N5

NEKETOC 555 in Python для анализа данных
Всем привет.  Есть вопрос : хочу провести анализ в датафрейме . Есть  две колонки с данными  для сравнения .  Создаю новую колонку  для вывода расчета и столкнулся с такой проблемой : как вывести результат в колонки ?
мой код"""""
rates_frame['type_range'] = rates_frame['open'] < rates_frame ['close']
"""""""
может кто подскажет каким методом это сделать... Результаты выводятся в сравнении , если меньше то -> S
если больше то -> B
источник