Телеграмм чат группы hadoopusers страница 2604

и всем снова привет.

пожскажите пож - а есть какой то человеческий способ отправить в кубер hdfs+hive+hive metastore+spark?

как это делают правильные и праведные люди?

Вроде кто-то вкорячил хайв метастор в кубер

источник

14:22пожаловаться #3

ЕГ

Евгений Глотов... in Data Engineers

Может есть и метастор поверх s3

источник

14:22пожаловаться #4

ЕГ

Евгений Глотов... in Data Engineers

Было бы попроще наверн

источник

14:22пожаловаться #5

АЖ

Андрей Жуков... in Data Engineers

Евгений Глотов

Может есть и метастор поверх s3

конечно, есть

источник

14:22пожаловаться #6

ЕГ

Евгений Глотов... in Data Engineers

Чем хдфс

источник

14:22пожаловаться #7

ЕГ

Евгений Глотов... in Data Engineers

Но блин с этим кубером все забыли, что данные нужно не только обрабатывать, но и хранить где-то)

источник

14:23пожаловаться #8

Alex in Data Engineers

сам хайв ведь не проблема, можно хоть 10 инстансов поднять
так как он стучится уже в реляционку, а вот её запихивать в кубер хзхз

источник

14:23пожаловаться #9

АЖ

Андрей Жуков... in Data Engineers

ну да, проблема именно с метастором

источник

14:23пожаловаться #10

АЖ

Андрей Жуков... in Data Engineers

но это надо просто инстанс субд поднять

источник

14:23пожаловаться #11

АЖ

Андрей Жуков... in Data Engineers

а не тащить чо попало в кубы

источник

14:23пожаловаться #12

Alex in Data Engineers

Евгений Глотов

Но блин с этим кубером все забыли, что данные нужно не только обрабатывать, но и хранить где-то)

сразу все говорят про даталокалити и делают hdfs
потом рассказывают что s3 рулить, сеть быстрая, даталокалити не нужна
потом добавляют s3 select api чтобы лишние данные не гонять по сети так как это долго и дорого, лучше выполнять фильтрацию рядом с данными

жду очередной итерации

источник

14:25пожаловаться #13

АЖ

Андрей Жуков... in Data Engineers

потом еще накидывают стопицот гейтов с3

источник

14:25пожаловаться #14

Ivan in Data Engineers

да блин на весь стек есть helm-чарты

и спарк
и хдфс+хайв+метастор
и зеппелин с суперсетом

и даже персистентность там включается

просто ставится это какой то разножопицей, и вечно всплывают мелкие косяки. например:
спарк не тянет паркет из хдфс - либы не хватает какой то. не беда доставить, но это ведь до первого перезапуска.

или - в хдфс не получить рутовые права, а без них юзера не сделать

источник

14:26пожаловаться #15

АЖ

Андрей Жуков... in Data Engineers

Ivan

ну так надо править чарты и делать свои контейнеры

источник

14:26пожаловаться #16

АЖ

Андрей Жуков... in Data Engineers

магии не бывает

источник