Size: a a a

Django [ru] #STAY HOME

2020 August 22

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Dima Boger
А не вынести преобразование на сторону базы? 😈
Что имеешь ввиду?
источник

DB

Dima Boger in Django [ru] #STAY HOME
расскажи чуть подробнее про преобразование
источник

DB

Dima Boger in Django [ru] #STAY HOME
кажется что проблема где-то там
источник

DB

Dima Boger in Django [ru] #STAY HOME
если я бы решал влоб, то я бы распаллелил воркерами селери, благо их несложно скейлить

размер чанка нужно подобрать, чтобы оверхед на селери был не таким большим по отношению к затратам на саму логику
источник

DB

Dima Boger in Django [ru] #STAY HOME
ну и пандас/numpy на самом деле хороший совет, скорее всего преобразования можно заметно ускорить, если разобраться
источник

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Dima Boger
расскажи чуть подробнее про преобразование
Ну вот в ячейках хранятся разные данные.
Например, тэги, категории записаны в одну строку и разделены каким-то символом. Мне нужно их сплитить по этому символу, чтобы сделать список, так как в бд они хранятся, как mtm.
Есть данные с символами, которые нужно просто удалить.
Есть различные форматы дат, которые нужно привести к одному.
Есть ячейке с пустыми значениями, хотя в бд их нужно заполнять.

В общем, таблицы заполняет, какой-то мудак, а мне нужно настроить все это, чтобы оно сохранялось в бд адекватно.
источник

DB

Dima Boger in Django [ru] #STAY HOME
100% пандас
источник

DB

Dima Boger in Django [ru] #STAY HOME
Если нет запросов наружу во время обработки, то пандас знатно должен ускорить процесс
источник

DB

Dima Boger in Django [ru] #STAY HOME
Если строки друг от друга не зависят, то запараллелить в таску, если нужно решить в лоб и сейчас
источник

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Dima Boger
Если строки друг от друга не зависят, то запараллелить в таску, если нужно решить в лоб и сейчас
Не зависят
источник

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Dima Boger
Если строки друг от друга не зависят, то запараллелить в таску, если нужно решить в лоб и сейчас
Мне это не горит. Просто в будущем придётся оптимизировать.
Вот думаю, либо селери чанки, либо процессы брать
источник

DB

Dima Boger in Django [ru] #STAY HOME
селери, кмк, удобнее — легче скейлить, можно легко вынести на соседний сервер по-мощнее при необходимости
источник

DB

Dima Boger in Django [ru] #STAY HOME
не нужно думать о том, что придёт сразу много запросов и выжрешь пул процессоров, потому что пул воркеров от кода приложения независим, и всё не поместившееся будет ждать в очереди
источник

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Dima Boger
не нужно думать о том, что придёт сразу много запросов и выжрешь пул процессоров, потому что пул воркеров от кода приложения независим, и всё не поместившееся будет ждать в очереди
А об этом я не подумал, кстати
источник

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Спасибо
источник

tn

tot samiy neizvestni... in Django [ru] #STAY HOME
Dima Boger
не нужно думать о том, что придёт сразу много запросов и выжрешь пул процессоров, потому что пул воркеров от кода приложения независим, и всё не поместившееся будет ждать в очереди
Если я запускаю 4 воркера, есть 4 таски в параллеле, это значит, что каждый воркер будет выполнять свою таску? Или я что-то не так понимаю?
источник

DB

Dima Boger in Django [ru] #STAY HOME
tot samiy neizvestniy
Если я запускаю 4 воркера, есть 4 таски в параллеле, это значит, что каждый воркер будет выполнять свою таску? Или я что-то не так понимаю?
Да, все так. Свободный воркер возьмёт таску из очереди
источник

N

Nire in Django [ru] #STAY HOME
Где в Питере можно англ вариант Django for professional найти?
источник

N

Nire in Django [ru] #STAY HOME
Мб в коворкинге каком есть
источник

I

InzGIBA in Django [ru] #STAY HOME
А можно чтобы она код вместо меня тестами покрывала?
источник