Size: a a a

Python для анализа данных

2021 July 23

EZ

Egor Zhulanov in Python для анализа данных
Крайний раз чтение из файла (около 200к файлов с содержимым 100к строк внутри каждого) + concat всех этих файлов отрабатывало около 20-30 минут
источник

K

Kseniia in Python для анализа данных
Хренасе нынешнее поколение!!! Я помню, как 10 лет назад у меня Эксель в принципе не мог обработать 10 тысяч строкю
источник

EZ

Egor Zhulanov in Python для анализа данных
Ну перепишите код, избавься от лишних действий и будет быстрее
источник

AD

Andrew Dakhnovsky in Python для анализа данных
это нормально на таком объеме
источник

h

helby in Python для анализа данных
остальное сделал быстрее чем было

вот пока именно эту функцию надо преобразовать)

дальше буду заново все смотреть
источник

EZ

Egor Zhulanov in Python для анализа данных
Убери лукап, преобразуй к дате уже после объединения строк
источник

h

helby in Python для анализа данных
вот, это по делу

спасибо

Сейчас попробую
источник

I

Igor in Python для анализа данных
Обидно, что я это написал несколько сообщений назад, но никто не отреагировал 😐)))
источник

EZ

Egor Zhulanov in Python для анализа данных
Согласен👌
источник

EZ

Egor Zhulanov in Python для анализа данных
Так быстрее может будет, но 5 млн строк это не мало, не жди супер ускорения.
источник

h

helby in Python для анализа данных
сори, не привык когда так часто не отвечаю)

вам тоже спасибо
источник

h

helby in Python для анализа данных
ну я просто сравниваю со скоростью на другом языке
источник

EZ

Egor Zhulanov in Python для анализа данных
🤣
Можешь не сравнивать, а выполнить действие сразу на другом языке
источник

RP

Roma Paranoid in Python для анализа данных
Можно ещё попробовать то, что в скобках, заменить на df[‘date’].astype(str).values + ‘ ‘ + df[‘time’].astype(str).values
источник

SS

Sergey Svetlov in Python для анализа данных
Если есть повторы "дата+время", то можно ускориться не вычисляя эти повторы.
источник

h

helby in Python для анализа данных
нормик короче

уложился в 25 секунд на всю задачу

П.С( не правильно засекал время)
источник

h

helby in Python для анализа данных
спасибо за помощь
источник

h

helby in Python для анализа данных
Ребята, а тут Р кто то понимает?

Просто всё таки функция выполняется 25 секунд

Хочу скинуть код в Р, и время его выполнения

И попросить помочь достичь таких же показателей в питоне

Хочется написать нормальный код, а не так чтобы отстали
источник

A

Alexandr in Python для анализа данных
А нельзя параллелизировать вычисления?
источник

h

helby in Python для анализа данных
с помощью dask?
источник