Телеграмм чат группы hadoopusers страница 3048

чтобы понять, что для тебя лучше-нужно про каждый понимать, что он из себя представляет. это как спросить-анальгин мне поможет? ну от головы да, от рака-нет.

источник

17:55пожаловаться #3

Nikita Blagodarnyy in Data Engineers

Sergey Kaurov

Arenadata - я так понимаю лучшее?

если не читаешь по английски-то единственная. а так вот тут читай

https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/FairScheduler.html

источник

17:57пожаловаться #4

Sergey Kaurov in Data Engineers

Да у меня пока по простому всё. 2.7.7 hadoop и Zeppelin.
Только сейчас стали задачи появляться, что можно улучшить и как. У меня в команде спецов нет. Есть удалённо хороший спец, но там в мыле от задач.

источник

17:58пожаловаться #5

Sergey Kaurov in Data Engineers

А история логов растёт 🌿 и запросы как резиновые растягиваются на год иногда...

источник

18:01пожаловаться #6

Max Efremov in Data Engineers

Sergey Kaurov

А для моей задачи Fair Sheduler лучше?

у самого похожая проблема, пока ещё ничего не менял в конфигах

источник

18:04пожаловаться #7

Sergey Kaurov in Data Engineers

Ещё подзадача - оптимизировать конфигурацию hadoop.
🦾 А есть варианты, которые отличаются в лучшую сторону от того, что по умолчанию?

источник

18:05пожаловаться #8

Sergey Kaurov in Data Engineers

Max Efremov

у самого похожая проблема, пока ещё ничего не менял в конфигах

Вот буду изучать - придётся менять.

источник

18:06пожаловаться #9

Anton Zadorozhniy in Data Engineers

Sergey Kaurov

надо начать с того что смотреть на утилизацию (как со стороны YARN что вы уже делаете, так и на самих узлах в каком-нибудь прометее), понять сколько каким пользователям нужно...

источник

18:55пожаловаться #10

Anton Zadorozhniy in Data Engineers

но вообще, судя по вашему текущему кластеру, мб вернуться к архитектурному вопросу и отказаться от хадупа, если данных сейчас немного и они особенно расти не будут.. управлять данными просто в одном гордом постгресе будет гораздо проще, инструментов больше..

источник

18:57пожаловаться #11

Sergey Kaurov in Data Engineers

Данных дофигищщааа просто.. Вот в этом как раз и суть. А все запросы все делают под одним пользователем.

источник

19:12пожаловаться #12

Sergey Kaurov in Data Engineers