Size: a a a

2019 December 13

K

KrivdaTheTriewe in Data Engineers
Alexander
Бизнес требования.
Жалко, ну делаете инсерт оверрайт в партицию из самой себя  хайвом , и указываете что мерджить если файлы меньше такого то размера , в зависимости от движка разные опции, хайв видит что маленький файл и запускает дор редьючеры , которые мерджат их
источник

A

Alex in Data Engineers
Grigory Pomadchin
Сдаётся мне пошло это обсуждения после спарка на к8с
да, именно после него, так как в случае ярна и месоса всё просто
источник

K

KrivdaTheTriewe in Data Engineers
Но я рекомендую хранить в одноосном формате
источник

GP

Grigory Pomadchin in Data Engineers
Alex
да, именно после него, так как в случае ярна и месоса всё просто
но вот помню что в спарке 2.2фк8с мне прям понравилась идея шафл сервисов
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
но вот помню что в спарке 2.2фк8с мне прям понравилась идея шафл сервисов
Можно сча сделать стартап прям
источник

K

KrivdaTheTriewe in Data Engineers
За деньги шафл сервис спарка продавать в облаке
источник

K

KrivdaTheTriewe in Data Engineers
источник

A

Alex in Data Engineers
“2.2фк8с” это что?
источник

K

KrivdaTheTriewe in Data Engineers
Alex
“2.2фк8с” это что?
Форк спарка
источник

GP

Grigory Pomadchin in Data Engineers
Alex
“2.2фк8с” это что?
Spark 2.2-k8s
источник

GP

Grigory Pomadchin in Data Engineers
да когда он был форком
источник

A

Alex in Data Engineers
а, понял, до того как смержили в основной
источник

UD

Uncel Duk in Data Engineers
KrivdaTheTriewe
За деньги шафл сервис спарка продавать в облаке
weka.io же
источник

UD

Uncel Duk in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
@krivdathetriewe плакали наши денюжки
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
кстати спарководы, как вы относитесь к инициативе ?
https://issues.apache.org/jira/browse/SPARK-25299
это нужно кое-кому чтобы делать серверлесс спарк, то есть по сути аналог гугловых датафлоу шаффл / стриминг энджин
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
@krivdathetriewe плакали наши денюжки
Давай другое
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
это нужно кое-кому чтобы делать серверлесс спарк, то есть по сути аналог гугловых датафлоу шаффл / стриминг энджин
Кому?
источник

AZ

Anton Zadorozhniy in Data Engineers
ну кто делает серверлесс сервисы?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
это нужно кое-кому чтобы делать серверлесс спарк, то есть по сути аналог гугловых датафлоу шаффл / стриминг энджин
@pomadchin вот можно сделать
источник