Телеграмм чат группы hadoopusers страница 1871

вообще, я как-то не верю, что количество этих моделек прям зашкаливает. однотипные рано или поздно набираются в библиотеку, из которой уже можно собирать data flow

источник

17:33пожаловаться #12

DZ

Dmitry Zuev in Data Engineers

Евгений Глотов

Новых инженеров не найдёшь, сайнтистам готовый кусок кода не передашь

Что касаемо поддержки кода, то скала уж точно выигрывает за счёт компиляции минимум

источник

17:33пожаловаться #13

AE

Alexey Evdokimov in Data Engineers

а с готовыми кусками на скале сатанист уже справится

источник

17:33пожаловаться #14

ЕГ

Евгений Глотов in Data Engineers

Dmitry Zuev

И причем тут отказоустойчивость?

Да, действительно, не тот термин выбрал

источник

17:34пожаловаться #15

R

Renarde in Data Engineers

Dmitry Zuev

При чем тут хттп? Kafka

ну вот у тебя есть модель на 60 млрд транзакций + 2к фичей по каждой из них, если ты отправишь даже в пожатом виде 60 млрд записей в кафка-сервис с питоновской моделью, это не будет так же быстро как заброадкастить модель и применить ее через спарк

источник

17:34пожаловаться #16

DZ

Dmitry Zuev in Data Engineers

Renarde

ну вот у тебя есть модель на 60 млрд транзакций + 2к фичей по каждой из них, если ты отправишь даже в пожатом виде 60 млрд записей в кафка-сервис с питоновской моделью, это не будет так же быстро как заброадкастить модель и применить ее через спарк

Тудой сюдой

источник

17:35пожаловаться #17

ЕГ

Евгений Глотов in Data Engineers

Dmitry Zuev

Что касаемо поддержки кода, то скала уж точно выигрывает за счёт компиляции минимум

Компиляция спарк-эскуэль кода, к сожалению, не очень сильно помогает избежать в нём ошибок на этапе выполнения)

источник

17:36пожаловаться #18

ЕГ

Евгений Глотов in Data Engineers

Renarde

ну вот у тебя есть модель на 60 млрд транзакций + 2к фичей по каждой из них, если ты отправишь даже в пожатом виде 60 млрд записей в кафка-сервис с питоновской моделью, это не будет так же быстро как заброадкастить модель и применить ее через спарк

sticker.webp

(26.32 Кб)

источник

17:36пожаловаться #19

DZ

Dmitry Zuev in Data Engineers

Если это питон модель то все равно через arrow пойдет

источник

17:36пожаловаться #20