Телеграмм чат группы hadoopusers страница 3452

Паша Финкельштейн... in Data Engineers

09:28пожаловаться #3

ПФ

KrivdaTheTriewe

Это очень простой код

09:28пожаловаться #4

Nikita Blagodarnyy in Data Engineers

KrivdaTheTriewe

Есть и другие способы )

Поделишься?

09:38пожаловаться #5

Nikita Blagodarnyy in Data Engineers

KrivdaTheTriewe

Даже если так будет , кода все равно будет меньше

Есть одно но. Ограничение на число полей в классе.

09:38пожаловаться #6

Vlad in Data Engineers

Ребят не подскажите

10:37пожаловаться #7

Vlad in Data Engineers

Какую команду необходимо написать чтоб скопировать file.txt размером 10 Тб из ПАПКИ /data/ в /tmp/

10:38пожаловаться #8

T in Data Engineers

Vlad

Какую команду необходимо написать чтоб скопировать file.txt размером 10 Тб из ПАПКИ /data/ в /tmp/

10:40пожаловаться #9

Но Спарк и не всем подходит, у него понятная область применимости но за рамками это области - очень больно и очень дорого (ну или ждать пока delta engine всем дадут)

А какая у него область применимости?

10:43пожаловаться #10

No Name

А какая у него область применимости?

мы про батчевые пайплайны говорили (ETL), спарк это бигдата, когда пайплайны широкие но их мало, мало обновлений и удалений, да вы лучше меня знаете

10:58пожаловаться #11

Ну мало ли, вдруг что-то новое услышу)

11:01пожаловаться #12

No Name

Ну мало ли, вдруг что-то новое услышу)

у меня только старое 😞

11:02пожаловаться #13

А дельта энжин прям настолько хорош?

11:02пожаловаться #14

у меня только старое 😞

Ну, тоже неплохо, не нужно срочно все перепиливать

11:03пожаловаться #15

No Name

А дельта энжин прям настолько хорош?

я сам не трогал, но говорят что сильно лучше спарка

11:03пожаловаться #16

Yuri Lyulchenko in Data Engineers

Кто-нибудь может помочь разобраться как во Flink из топика можно получить записи в формате GenericData (Avro), используя схему из SchemaRegistry? Что-то совсем залип.... ☹️

11:03пожаловаться #17

er@essbase.ru in Data Engineers

я сам не трогал, но говорят что сильно лучше спарка

Какие у него киллер фичи ?

11:04пожаловаться #18

er@essbase.ru

Какие у него киллер фичи ?

не тормозит (на старте, в процессинге и нормальная утилизация), кэширование

11:07пожаловаться #19

то есть это нормальная МРР СУБД, но которая понимает Spark API