Так в этом случае xmx на шёл это сколько локально у вас в клиенте, и не уверен что там hadoop параметры подтягиваются, на само выполнение это не сильно влияет
Постмортем такой: Пользователь пускает селект через hive cli Запрос падает по OOM Гугл рекомендует пользователь накинуть общего хипа через HADOOP_HEAPSIZE (дальше там есть через рекомендация через параметр хайва, что понятнее) При передаче увеличенного значения хипа через HADOOP_HEAPSIZE запрос успешно выполняется
Т.е. выглядит так, что эта переменная окружения перед запросом в hive cli работает. Если так, то хочу увидеть фактическое отображение переданного значения и хипа.
Возможно у вас вывод ответа в память не влазит если какой селект используете
Насколько я помню стартовые скрипты клоудеры, то там shell скрипт запуска указанного сервиса по очереди перебирает от более специфичных для сервиса до более generic
Типо Hive_cli_heapsize Если нету то Hadoop_heapsize И тд
Формирует строку запуска и уже запускает нужный Jar с параметрами main класса и jvm опциями
Есть ещё нюанс, с клоудерой сталкивался, что они по очереди ставят Xmx от всех параметров, в итоге у вас на процессе их несколько штук, выигрывает последний :)
Есть ещё нюанс, с клоудерой сталкивался, что они по очереди ставят Xmx от всех параметров, в итоге у вас на процессе их несколько штук, выигрывает последний :)
Я клаудеровскую доку упоминул просто так. Цитата там удобная была