Size: a a a

Scalability Camp — чат про распределенные системы (и про HPC)

2020 July 09

KZ

Kir Zharov in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
Смотря сколько данных перегонять и что с ними в процессе делать
Потенциально нужно будет гонять много данных
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Kir Zharov
Потенциально нужно будет гонять много данных
Потоковых? Или, скажем, датафреймы батчами пересылать с обработкой в процессе?
источник

AB

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)
а настарте будет много  или потом @kirillzharov  ?
источник

KZ

Kir Zharov in Scalability Camp — чат про распределенные системы (и про HPC)
Aleksandr Borgardt
а настарте будет много  или потом @kirillzharov  ?
На старте не так много, планировал процессить файлы в JSON на стороне фронта
источник

KZ

Kir Zharov in Scalability Camp — чат про распределенные системы (и про HPC)
И дальше отправлять в апишку, вместо скриптов в ноутбуках, сами ноутбуки напрямую работают с файлами
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Kir Zharov
На старте не так много, планировал процессить файлы в JSON на стороне фронта
А зачем на стороне фронта вообще что-то процессить? Просто интересно
источник

KZ

Kir Zharov in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
Я бы такое, честно сказать, писал на го. Он для этого очень хорошо подходит
Го хорош, с этим не поспоришь 🔥
источник

KZ

Kir Zharov in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
А зачем на стороне фронта вообще что-то процессить? Просто интересно
Подумал, что так должно быть быстрее, чем гонять файлы, по сути "процесинг", это парсинг CSV файлов, для примера
источник

KZ

Kir Zharov in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
Потоковых? Или, скажем, датафреймы батчами пересылать с обработкой в процессе?
Скорее датафреймы
источник

EM

Evgeniy Moiseev in Scalability Camp — чат про распределенные системы (и про HPC)
Aleksandr Borgardt
советую не использовать  asyncio   и маштбаироватся  процессмами
Так себе рекомендация. Юзайте ProcessPool и будет вам счастье. Мало того можно замутить reusable processpool-ы, чтобы сэкономить на времени инициализации.
источник

AB

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)
Process pool твоя придумка
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Evgeniy Moiseev
Так себе рекомендация. Юзайте ProcessPool и будет вам счастье. Мало того можно замутить reusable processpool-ы, чтобы сэкономить на времени инициализации.
Смотря какая версия питона :) в 3.8 имеет смысл, раньше - uwsgi будет таки побыстрее и понадежнее
источник

N

Nikolay in Scalability Camp — чат про распределенные системы (и про HPC)
Aleksandr Borgardt
Process pool твоя придумка
Он про concurrent.futures.ProcessPoolExecutor, как я понимаю. В целом норм
источник

EM

Evgeniy Moiseev in Scalability Camp — чат про распределенные системы (и про HPC)
именно
источник

AB

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)
Таких советов я не давал
источник

EM

Evgeniy Moiseev in Scalability Camp — чат про распределенные системы (и про HPC)
я потерял нить дискуссии
источник

AB

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)
Nikolay
Смотря какая версия питона :) в 3.8 имеет смысл, раньше - uwsgi будет таки побыстрее и понадежнее
Etl + процессы идея разумная
источник
2020 July 11

RS

Roman Sakal in Scalability Camp — чат про распределенные системы (и про HPC)
Карчое, в любой непонятной ситуации рассказывай про CAP теорему.
Пускай подумают, что ты её понимаешь.
источник
2020 July 16

ZO

Zlata Obukhovskaya in Scalability Camp — чат про распределенные системы (и про HPC)
Всем привет! У нас новый выпуск подкаста, нам нужны ваши лайки и репосты :) https://soundcloud.com/scalability-camp/scalability-podcast-3
источник

AB

Aleksandr Borgardt in Scalability Camp — чат про распределенные системы (и про HPC)
источник