Size: a a a

2020 September 18

AE

Alexey Evdokimov in Data Engineers
универсальных потребностей не бывает потому что не бывает универсальных задач. кому-то надо сложно копаться в данных, а кому-то надо заряжать терабайты в числодробилку
источник

AE

Alexey Evdokimov in Data Engineers
соответственно и код будет выглядеть совсем иначе
источник

AE

Alexey Evdokimov in Data Engineers
я был бы очень рад обойтись каким-нить sql-ем, чтобы сджойнить мои миллионы записей с миллиардами, но на таких объёмах кластерный оракл будет дорогой как чёрт знает что. на спарке отлично получается делать всё то же самое, но только солнышко приходится закатывать вручную временами
источник

N

Nikita Blagodarnyy in Data Engineers
Alexey Evdokimov
я был бы очень рад обойтись каким-нить sql-ем, чтобы сджойнить мои миллионы записей с миллиардами, но на таких объёмах кластерный оракл будет дорогой как чёрт знает что. на спарке отлично получается делать всё то же самое, но только солнышко приходится закатывать вручную временами
Вы при этом не используете DataSet-API ? Или про рдд это не оттуда?
источник

AE

Alexey Evdokimov in Data Engineers
была бы схема, юзал бы датасеты. но схема у меня возникает в контексте каждой мелкой задачи, коиз десятки, и как ею управлять, нормального способа не нашёл
источник

AE

Alexey Evdokimov in Data Engineers
и с субд пришлось бы сотнями вьюх обкладываться на лету
источник

DZ

Dmitry Zuev in Data Engineers
Яннп. Для такого есть датафреймы
источник

AE

Alexey Evdokimov in Data Engineers
в общем, невменяемым задачам — невменяемые решения ¯\_(ツ)_/¯
источник

DZ

Dmitry Zuev in Data Engineers
Помянем
источник

AE

Alexey Evdokimov in Data Engineers
ну, они работают, и даже какое-то бабло приносят
источник

AE

Alexey Evdokimov in Data Engineers
рано хоронить :)
источник

DZ

Dmitry Zuev in Data Engineers
Да не решение. А что приходится такое делать, ещё и на джаве
источник

AZ

Anton Zadorozhniy in Data Engineers
В СУБД разные технологии есть, к примеру можно написать логику хоть на Go и стримить данные параллельно со всех узлов и делать что там нужно, для каких-то сценариев это очень удобно
источник

OA

Oleksandr Averchenko in Data Engineers
Anton Zadorozhniy
В СУБД разные технологии есть, к примеру можно написать логику хоть на Go и стримить данные параллельно со всех узлов и делать что там нужно, для каких-то сценариев это очень удобно
Почему бы не написать логику на SQL
источник

OA

Oleksandr Averchenko in Data Engineers
источник

OA

Oleksandr Averchenko in Data Engineers
И фронтенд тоже.
источник

DZ

Dmitry Zuev in Data Engineers
Oleksandr Averchenko
Почему бы не написать логику на SQL
Вы молодые, смешливые. Не надо вскрывать эту тему
источник

AZ

Anton Zadorozhniy in Data Engineers
Oleksandr Averchenko
Почему бы не написать логику на SQL
переписать XGBoost на SQL, и всем будет удобно!
источник

OA

Oleksandr Averchenko in Data Engineers
Anton Zadorozhniy
переписать XGBoost на SQL, и всем будет удобно!
Как два пальца об асфальт.
источник

OA

Oleksandr Averchenko in Data Engineers
источник