Size: a a a

Python для анализа данных

2021 July 23

A

Alexandr in Python для анализа данных
pandarallel или multiprocessing? Не уверен, что dask здесь нужен
источник

IS

Ilya Shutov in Python для анализа данных
старт параллельных процессов — штука не моментальная, тоже требует времени. Может надо с целевого показателя времени начать?
источник

IS

Ilya Shutov in Python для анализа данных
во что метиться?
источник

h

helby in Python для анализа данных
погуглю щас
источник

A

Alexandr in Python для анализа данных
5 млн строк на 8 секунд вроде
источник

h

helby in Python для анализа данных
5 секунд все таки
источник

h

helby in Python для анализа данных
на Р
источник

IS

Ilya Shutov in Python для анализа данных
на инициализацию многопотока может уйти 2-3 секунды (зависит от ОС). А потом на сборку и очистку.
Великоваты накладные будут
источник

A

Alexandr in Python для анализа данных
Ого! Про инициализацию не знал, что так долго!
источник

IS

Ilya Shutov in Python для анализа данных
это внутренности ОС+ создание контекста + передача окружения
источник

ee

elnur elnur in Python для анализа данных
спасибо за дельный совет👍
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Потому что это брехня.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Распространяемая адептами так называемого асинхронного программирования
источник

h

helby in Python для анализа данных
Так а что по вопросу?

Знает кто то Р?
Для того чтобы помочь достичь в питоне время выполнения задачи, с фреймом в 5 млн строк, за 5 секунд?
источник

ee

elnur elnur in Python для анализа данных
Резник Александр Давидович
"Книга для тех, кто не любит статистику, но вынужден ею пользоваться"
источник

AD

Andrew Dakhnovsky in Python для анализа данных
очень
очень смелое заявление
есть какие-нибудь факты подтверждающие данный тезис?

при мультипроцессе у тебя фактически стартуют несколько питонов со всеми потрохами
с подгрузкой и инициализацией всех либ включая нампи пандас и т.д.
что само по себе небыстро
мультитридинг немного быстрее
про адептов т.н. асинхронного программирования посмеялся
ИО-баунд, ЦПУ-баунд...
при чем тут оно?
источник

IS

Ilya Shutov in Python для анализа данных
Может поясните? Ос, как минимум должна создать форки, потоки или процессы. Мастер процесс должен раздать задание и данные, а потом собрать и сделать reduce.
Не говоря уж о теоретических лимитах и законах, например, законе амдала. И при чем здесь асинхронность?

Лучше стереть свой ответ, он выглядит слишком компрометирующим
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Компрометирующим вкатывальщиков, которые не знающих что такое профилирование? Нет, пусть висит
источник

IS

Ilya Shutov in Python для анализа данных
Ну пусть висит, категоричность очень часто присуща неофитам. Время правит.

Только уж от хамства и панибратства воздержитесь. Пятница, трудная неделя, все понятно. Но не оправдывает.
источник

AD

Andrew Dakhnovsky in Python для анализа данных
а при чем тут инструмент для оценки и мониторинга производительности к оверхеду на старте мультипотоков?
есть скриншоты/замеры доказывающие что оверхеда не существует?
источник