Size: a a a

2020 October 09

AA

Artem Arzhanov in Data Engineers
А дока у них сейчас по сути общая же
источник

A

Alex in Data Engineers
Да, сейчас там местами каша, но дисты все равно разные пока

Unity что обещали я пока не видел
источник

UD

Uncel Duk in Data Engineers
Artem Arzhanov
Постмортем такой:
Пользователь пускает селект через hive cli
Запрос падает по OOM
Гугл рекомендует пользователь накинуть общего хипа через HADOOP_HEAPSIZE (дальше там есть через рекомендация через параметр хайва, что понятнее)
При передаче увеличенного значения хипа через HADOOP_HEAPSIZE запрос успешно выполняется
Хип можно посмотреть через jps
источник

A

Alex in Data Engineers
По хортону могу более точно сказать завтра, когда к компу доберусь
источник

UD

Uncel Duk in Data Engineers
И лучше использовать билайн вместо хайвкли
источник

AA

Artem Arzhanov in Data Engineers
Uncel Duk
Хип можно посмотреть через jps
jps кажет pid процесса, который смотрю через ps. Просто мне так удобно
источник

AA

Artem Arzhanov in Data Engineers
Alex
По хортону могу более точно сказать завтра, когда к компу доберусь
Про особенности дистров это понятно. Тут же, имхо, дистронезависимый кейс. Запускатся в шелле hive cli, в нем селект в базу
источник

UD

Uncel Duk in Data Engineers
Artem Arzhanov
jps кажет pid процесса, который смотрю через ps. Просто мне так удобно
-mlvV
источник

UD

Uncel Duk in Data Engineers
а так отгрепайте скрипты который тащатся за хайвкли
источник

UD

Uncel Duk in Data Engineers
у всех дистров там месиво
источник

AA

Artem Arzhanov in Data Engineers
Да я вижу конкретную jvm с запросом
источник

AA

Artem Arzhanov in Data Engineers
Там указан дефолтный xmx, который задан в tez’е
источник

AA

Artem Arzhanov in Data Engineers
Поэтому не врубаю как эта переменная окружения разворачивается
источник

AA

Artem Arzhanov in Data Engineers
Ощущение, что никак. Но передаёшь её с увеличенным хипом - запрос отрабатывает
источник

A

Alex in Data Engineers
Artem Arzhanov
Про особенности дистров это понятно. Тут же, имхо, дистронезависимый кейс. Запускатся в шелле hive cli, в нем селект в базу
Вот тут и начинается веселье

Никогда не стоит недооценивать дистростроителей
источник

AA

Artem Arzhanov in Data Engineers
Alex
По хортону могу более точно сказать завтра, когда к компу доберусь
Не утруждайтесь в выходной)
Спасибо
источник

UD

Uncel Duk in Data Engineers
if [ "$SERVICE" = "cli" ]; then
 if [ -z "$DEBUG" ]; then
   export HADOOP_OPTS="$HADOOP_OPTS -XX:NewRatio=12 -Xms10m -XX:MaxHeapFreeRatio=40 -XX:MinHeapFreeRatio=15 -XX:+UseParNewGC -XX:-UseGCOverheadLimit"
 else
   export HADOOP_OPTS="$HADOOP_OPTS -XX:NewRatio=12 -Xms10m -XX:MaxHeapFreeRatio=40 -XX:MinHeapFreeRatio=15 -XX:-UseGCOverheadLimit"
 fi
fi
источник

UD

Uncel Duk in Data Engineers
хортон
источник

UD

Uncel Duk in Data Engineers
для сравнения билайн
источник

UD

Uncel Duk in Data Engineers
beeline -u 'jdbc:hive2:/hive_dns:port/' -n %username% --hiveconf tez.queue.name="dev" --hiveconf tez.am.resource.memory.mb=15000 --hiveconf mapreduce.map.memory.mb=30000 --hiveconf hiveconf mapreduce.reduce.memory.mb=30000 --hiveconf hive.exec.max.dynamic.partitions.pernode=40000 --hiveconf hive.exec.max.dynamic.partitions=50000 --hiveconf hive.server2.logging.operation.level=VERBOSE
источник