Телеграмм чат группы pydjango страница 19566

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Django [ru] #STAY HOME

3228 membersпожаловаться на группу

2020 August 22

DB

Dima Boger in Django [ru] #STAY HOME

фишка групп в том, что они обёрнуты в магическую джобу, которая собирает результат всех тасок в группе

поэтому если надо не просто выполнить 100 задач, но и потом посмотреть результат этих 100 задач, то это очень удобная абстракция

а ещё из других абстракций канваса можно собрать адски удобный пайплайн:

chain([
   prepare_data.s(),
   group([
      ...
   ]),
   process_result.s(),
]).delay()

источник

12:42пожаловаться #1

DB

Dima Boger in Django [ru] #STAY HOME

Mikhail Zanozin

Не совсем. Я про https://docs.celeryproject.org/en/stable/reference/celery.html#celery.Celery.send_task

Я всегда на практике запускают воркеры в другом пространстве и на нескольких хостах, поэтому в приложении, как правило, кода нет - он лежит под воркерами. Я так и не понял, плохо это или нет.

а, понял о чём ты

ну в небольших приложениях проще хранить всё рядом, потому что логика между приложением и фоновыми тасками шаренная (общие модели, общие куски бизнес-логики, етс)

источник

12:43пожаловаться #2

DB

Dima Boger in Django [ru] #STAY HOME

но даже если кидать в очередь по имени — остаётся вопрос как потом собрать результат 🤔

Всё равно захочется сделать сначала группу из task_name, а потом результат этого выполнения получить

источник

12:44пожаловаться #3

𝕬

𝕬𝕲𝖗𝖚𝖘 🥭... in Django [ru] #STAY HOME

tot samiy neizvestniy

Например, метод update переписать в сериалайзере

Это понятно, но все равно запрашивает все поля модели, когда требуется лишь одно.

источник

12:45пожаловаться #4

MZ

Mikhail Zanozin in Django [ru] #STAY HOME

но даже если кидать в очередь по имени — остаётся вопрос как потом собрать результат 🤔

Всё равно захочется сделать сначала группу из task_name, а потом результат этого выполнения получить

А вроде нет речи, что результат нужен на месте. Воркер имеет информацию о бэкенде, куда может опционально писать результат.

источник

12:45пожаловаться #5

DB

Dima Boger in Django [ru] #STAY HOME

𝕬𝕲𝖗𝖚𝖘 🥭

Это понятно, но все равно запрашивает все поля модели, когда требуется лишь одно.

переопределить get_queryset на использование с only

источник

12:46пожаловаться #6

DB

Dima Boger in Django [ru] #STAY HOME

Вообще можно подхачить и использовать чистый .save(update_fields=[...]) 🤔

не уверен что это много сэкономит

источник

12:47пожаловаться #7

tn

tot samiy neizvestni... in Django [ru] #STAY HOME

Есть веб-сервис на Python 3.7.
Флоу следующее:
1. Пользователь может загружать файлы (xls/csv) либо давать урл на гугл таблицу.
2. В таблице может быть неограниченное число строк - до 80к, например.
3. В каждой строке хранятся данные. Из каждой строки создаётся новая запись в базе данных (postgresql)
4. Каждая запись при сохранении индексируется в ElasticSearch.
5. Перед сохранением записи в бд нужно циклом пройти по каждой строке, чтобы привести данные в нужный формат.

Много времени уходит на саму обработку данных, чтобы привести их к нужному формату. Ну и делать 80к итераций это тоже зашквар ещё тот.

Всё это дело я вынес в celery.
Как можно оптимизировать? Потоки? Мультипроцессы? Селери чанки?

источник

13:11пожаловаться #8

AF

Anton Fircak in Django [ru] #STAY HOME

tot samiy neizvestniy

Есть веб-сервис на Python 3.7.
Флоу следующее:
1. Пользователь может загружать файлы (xls/csv) либо давать урл на гугл таблицу.
2. В таблице может быть неограниченное число строк - до 80к, например.
3. В каждой строке хранятся данные. Из каждой строки создаётся новая запись в базе данных (postgresql)
4. Каждая запись при сохранении индексируется в ElasticSearch.
5. Перед сохранением записи в бд нужно циклом пройти по каждой строке, чтобы привести данные в нужный формат.

Много времени уходит на саму обработку данных, чтобы привести их к нужному формату. Ну и делать 80к итераций это тоже зашквар ещё тот.

Всё это дело я вынес в celery.
Как можно оптимизировать? Потоки? Мультипроцессы? Селери чанки?

мб пандасы всякие для обработки таблицы? А так наверное на асинхронщину переписывай

источник

13:12пожаловаться #9

tn

tot samiy neizvestni... in Django [ru] #STAY HOME

Не думаю, что пандас тут особо поможет. Нужно как-то разбивать и параллелить, но хз как.

источник

13:13пожаловаться #10

MZ

Mikhail Zanozin in Django [ru] #STAY HOME

Пользователь должен видеть результат/прогресс выполнения в реалтайме или вообще?

У меня много таких задач - всякий раз "велосипеды".

источник

13:14пожаловаться #11

tn

tot samiy neizvestni... in Django [ru] #STAY HOME

Mikhail Zanozin

Пользователь должен видеть результат/прогресс выполнения в реалтайме или вообще?

У меня много таких задач - всякий раз "велосипеды".

Вообще не важно

источник

13:15пожаловаться #12

ZD

Zhan Dosov in Django [ru] #STAY HOME

Привет, есть тут python Junior программисты с города Астана?

источник

13:15пожаловаться #13

AF

Anton Fircak in Django [ru] #STAY HOME

ребят, а как переопределить удаление с админки сущности? def delete_model(self, request, object): чет не вызывается при удалении

источник

13:21пожаловаться #14

AG

Artem Gubatenko in Django [ru] #STAY HOME

ребят, а как переопределить удаление с админки сущности? def delete_model(self, request, object): чет не вызывается при удалении

кастомный Queryset по умолчанию, в нем переопределить .delete()

источник

13:22пожаловаться #15

AF

Anton Fircak in Django [ru] #STAY HOME

Artem Gubatenko

кастомный Queryset по умолчанию, в нем переопределить .delete()

а в модели, хмм спасибо

источник

13:22пожаловаться #16

AG

Artem Gubatenko in Django [ru] #STAY HOME

tot samiy neizvestniy

Есть веб-сервис на Python 3.7.
Флоу следующее:
1. Пользователь может загружать файлы (xls/csv) либо давать урл на гугл таблицу.
2. В таблице может быть неограниченное число строк - до 80к, например.
3. В каждой строке хранятся данные. Из каждой строки создаётся новая запись в базе данных (postgresql)
4. Каждая запись при сохранении индексируется в ElasticSearch.
5. Перед сохранением записи в бд нужно циклом пройти по каждой строке, чтобы привести данные в нужный формат.

Много времени уходит на саму обработку данных, чтобы привести их к нужному формату. Ну и делать 80к итераций это тоже зашквар ещё тот.

Всё это дело я вынес в celery.
Как можно оптимизировать? Потоки? Мультипроцессы? Селери чанки?

> Много времени уходит на саму обработку данных, чтобы привести их к нужному формату.

Мультипроцессы - должны помочь

источник

13:29пожаловаться #17

AG

Artem Gubatenko in Django [ru] #STAY HOME

+ действительно обрабатывать данные какой-то специальной библиотекой, написанной на Си

источник

13:30пожаловаться #18

tn

tot samiy neizvestni... in Django [ru] #STAY HOME

Artem Gubatenko

+ действительно обрабатывать данные какой-то специальной библиотекой, написанной на Си

Сложна

источник

13:31пожаловаться #19

DB

Dima Boger in Django [ru] #STAY HOME

tot samiy neizvestniy

Есть веб-сервис на Python 3.7.
Флоу следующее:
1. Пользователь может загружать файлы (xls/csv) либо давать урл на гугл таблицу.
2. В таблице может быть неограниченное число строк - до 80к, например.
3. В каждой строке хранятся данные. Из каждой строки создаётся новая запись в базе данных (postgresql)
4. Каждая запись при сохранении индексируется в ElasticSearch.
5. Перед сохранением записи в бд нужно циклом пройти по каждой строке, чтобы привести данные в нужный формат.

Много времени уходит на саму обработку данных, чтобы привести их к нужному формату. Ну и делать 80к итераций это тоже зашквар ещё тот.

Всё это дело я вынес в celery.
Как можно оптимизировать? Потоки? Мультипроцессы? Селери чанки?

А не вынести преобразование на сторону базы? 😈

источник

13:31пожаловаться #20