Size: a a a

2019 December 06

AE

Alexey Evdokimov in Data Engineers
а не jedem ли das seine? сатанистам — питон, иженеграм — жаба/скала
источник

В

Вадим in Data Engineers
Категоричность в субъективных суждениях у инженеров это больно
источник

DZ

Dmitry Zuev in Data Engineers
Alexey Evdokimov
а не jedem ли das seine? сатанистам — питон, иженеграм — жаба/скала
Так это уже было озвучено
источник

R

Renarde in Data Engineers
Alexey Evdokimov
а не jedem ли das seine? сатанистам — питон, иженеграм — жаба/скала
а потом модельки питонистов на scala натягивать больно будет
источник

DZ

Dmitry Zuev in Data Engineers
Renarde
а потом модельки питонистов на scala натягивать больно будет
А не надо. Делай сервис
источник

DZ

Dmitry Zuev in Data Engineers
Или pmml для любителей
источник

R

Renarde in Data Engineers
Dmitry Zuev
А не надо. Делай сервис
допустим тебе надо прокрутить 18ТБ транзакций - http rest / pmml просто умрут (или масштабирование дорого будет)
источник

AE

Alexey Evdokimov in Data Engineers
Renarde
а потом модельки питонистов на scala натягивать больно будет
ну, мне норм. или модельки не сильно сложные...
источник

R

Renarde in Data Engineers
вообще есть очень прикольные штуки для Scala + ML, например https://transmogrif.ai/
источник

DZ

Dmitry Zuev in Data Engineers
Renarde
допустим тебе надо прокрутить 18ТБ транзакций - http rest / pmml просто умрут (или масштабирование дорого будет)
При чем тут хттп? Kafka
источник

R

Renarde in Data Engineers
Другой вопрос что обычных DS не загонишь писать на Scala, потому что неудобно и все такое
источник

AE

Alexey Evdokimov in Data Engineers
вообще, я как-то не верю, что количество этих моделек прям зашкаливает. однотипные рано или поздно набираются в библиотеку, из которой уже можно собирать data flow
источник

DZ

Dmitry Zuev in Data Engineers
Евгений Глотов
Новых инженеров не найдёшь, сайнтистам готовый кусок кода не передашь
Что касаемо поддержки кода, то скала уж точно выигрывает за счёт компиляции минимум
источник

AE

Alexey Evdokimov in Data Engineers
а с готовыми кусками на скале сатанист уже справится
источник

ЕГ

Евгений Глотов in Data Engineers
Dmitry Zuev
И причем тут отказоустойчивость?
Да, действительно, не тот термин выбрал
источник

R

Renarde in Data Engineers
Dmitry Zuev
При чем тут хттп? Kafka
ну вот у тебя есть модель на 60 млрд транзакций + 2к фичей по каждой из них, если ты отправишь даже в пожатом виде 60 млрд записей в кафка-сервис с питоновской моделью, это не будет так же быстро как заброадкастить модель и применить ее через спарк
источник

DZ

Dmitry Zuev in Data Engineers
Renarde
ну вот у тебя есть модель на 60 млрд транзакций + 2к фичей по каждой из них, если ты отправишь даже в пожатом виде 60 млрд записей в кафка-сервис с питоновской моделью, это не будет так же быстро как заброадкастить модель и применить ее через спарк
Тудой сюдой
источник

ЕГ

Евгений Глотов in Data Engineers
Dmitry Zuev
Что касаемо поддержки кода, то скала уж точно выигрывает за счёт компиляции минимум
Компиляция спарк-эскуэль кода, к сожалению, не очень сильно помогает избежать в нём ошибок на этапе выполнения)
источник

ЕГ

Евгений Глотов in Data Engineers
Renarde
ну вот у тебя есть модель на 60 млрд транзакций + 2к фичей по каждой из них, если ты отправишь даже в пожатом виде 60 млрд записей в кафка-сервис с питоновской моделью, это не будет так же быстро как заброадкастить модель и применить ее через спарк
источник

DZ

Dmitry Zuev in Data Engineers
Если это питон модель то все равно через arrow пойдет
источник