Size: a a a

2020 October 09

AA

Artem Arzhanov in Data Engineers
tez
источник

A

Alex in Data Engineers
Так в этом случае xmx на шёл это сколько локально у вас в клиенте, и не уверен что там hadoop параметры подтягиваются, на само выполнение это не сильно влияет
источник

AA

Artem Arzhanov in Data Engineers
Постмортем такой:
Пользователь пускает селект через hive cli
Запрос падает по OOM
Гугл рекомендует пользователь накинуть общего хипа через HADOOP_HEAPSIZE (дальше там есть через рекомендация через параметр хайва, что понятнее)
При передаче увеличенного значения хипа через HADOOP_HEAPSIZE запрос успешно выполняется
источник

AA

Artem Arzhanov in Data Engineers
Т.е. выглядит так, что эта переменная окружения перед запросом в hive cli работает.
Если так, то хочу увидеть фактическое отображение переданного значения и хипа.
источник

AA

Artem Arzhanov in Data Engineers
Можно конечно зайти с другой стороны, и подиагностить сам запрос. Но тут я уже вопрос не сформулирую
источник

A

Alex in Data Engineers
Возможно у вас вывод ответа в память не влазит если какой селект используете

Насколько я помню стартовые скрипты клоудеры, то там shell скрипт запуска указанного сервиса по очереди перебирает от более специфичных для сервиса до более generic

Типо
Hive_cli_heapsize
Если нету то
Hadoop_heapsize
И тд

Формирует строку запуска и уже запускает нужный Jar с параметрами main класса и jvm опциями
источник

A

Alex in Data Engineers
Посмотрите shell скрипт который hive cli запускает
источник

AA

Artem Arzhanov in Data Engineers
Так ну это же тогда должно отображаться в параметрах конретного процесса в системе
источник

AA

Artem Arzhanov in Data Engineers
Да там без шелл скрипта. Прямо из консоли проверяю
источник

A

Alex in Data Engineers
Да, потом в ps вы увидете
источник

AA

Artem Arzhanov in Data Engineers
Ну вот ps кажет дефолтное значение, а не то, которое было через переменную окружения передано
источник

A

Alex in Data Engineers
А консоль что запускает?

Там 2 варианта, либо beeswax или java клиент :)
источник

A

Alex in Data Engineers
Artem Arzhanov
Ну вот ps кажет дефолтное значение, а не то, которое было через переменную окружения передано
Странно, должно проставиться
источник

AA

Artem Arzhanov in Data Engineers
Alex
А консоль что запускает?

Там 2 варианта, либо beeswax или java клиент :)
java
источник

A

Alex in Data Engineers
Есть ещё нюанс, с клоудерой сталкивался, что они по очереди ставят Xmx от всех параметров, в итоге у вас на процессе их несколько штук, выигрывает последний :)
источник

AA

Artem Arzhanov in Data Engineers
Просто думаю, что не работает эта переменная окружения и это просто совпадение, что запрос отрабатывает, когда она задана
источник

AA

Artem Arzhanov in Data Engineers
Alex
Есть ещё нюанс, с клоудерой сталкивался, что они по очереди ставят Xmx от всех параметров, в итоге у вас на процессе их несколько штук, выигрывает последний :)
Я клаудеровскую доку упоминул просто так. Цитата там удобная была
источник

A

Alex in Data Engineers
У клоудеры и хортона много своих оберток по запуску конкретных сервисов

Что-то от апача используют, что-то сами дописываеют, поэтому знать желательно что именно запускаете
источник

AA

Artem Arzhanov in Data Engineers
Так чисто hive cli
источник

AA

Artem Arzhanov in Data Engineers
Ну дистрибутив хадупа от хортона
источник