Телеграмм чат группы hadoopusers страница 3014

Zookeeper changed the zookeeper.properties file format and as a result NiFi users using an existing embedded zookeeper will need to adjust their existing zookeeper.properties file accordingly.

источник

00:38пожаловаться #5

Uncel Duk in Data Engineers

Как костыль можно запустить с собственным зк найфая

источник

00:39пожаловаться #6

Sergey Sheremeta in Data Engineers

так zookeeper.properties - это же для embedded-зукипера?

источник

00:39пожаловаться #7

Sergey Sheremeta in Data Engineers

то есть проще всего запустить ембеддед?

источник

00:40пожаловаться #8

Uncel Duk in Data Engineers

Да, если бампануть зк нельзя

источник

00:41пожаловаться #9

Sergey Sheremeta in Data Engineers

Uncel Duk

Да, если бампануть зк нельзя

спасибо огромное! очень выручили!!!

источник

00:45пожаловаться #10

Sergey Sheremeta in Data Engineers

воспользуюсь еще вашими знаниями...
в NiFI еще не появились процессоры под Oracle Logminer?

источник

00:48пожаловаться #11

Dmitriy Novikov in Data Engineers

Коллеги, добрый день, я тут озадачен, скажите пжз, кто из крупных современных проектов, вы используете orm в разработке или голый sql?

источник

01:08пожаловаться #12

Andrey Sutugin in Data Engineers

Всем привет! Вопрос как мониторить spark 3 на yarn через prometheus?
Есть spark 3 (в котором заявлена нативная интеграция с prometheus), добавил metrics.properties, указал все нужные --conf , а вот дальше что делать - не понимаю, что и как надо настроить в prometheus или еще где, что бы эти метрики забирались? А то в докладе (https://databricks.com/session_na20/native-support-of-prometheus-monitoring-in-apache-spark-3-0) и в статье (https://dzlab.github.io/bigdata/2020/07/03/spark3-monitoring-1/) все просто, но я в ops-овских делах, как свинья в апельсинах?

Databricks

Native Support of Prometheus Monitoring in Apache Spark 3.0 - Databricks

Native Support of Prometheus Monitoring in Apache Spark 3.0 at 2020 Spark + AI Summit presented by Dongjoon Hyun, DB Tsai

источник

07:07пожаловаться #13

Oleg Ilinsky in Data Engineers

Привет!
Кто-нибудь подключал к спарку в кубах persistantVolumeClaim?

Я ловлю вот такую ошибку при попытке использовать volume

20/12/09 11:07:13 ERROR Utils: Uncaught exception in thread kubernetes-executor-snapshots-subscribers-1
java.util.NoSuchElementException: key not found: persistentVolumeClaim.sparksubmitvol.options.claimName

конфиг вот такой:

--conf spark.kubernetes.executor.volumes.persistentVolumeClaim.sparksubmitvol.mount.path=/spill_local \
--conf spark.kubernetes.executor.volumes.persistentVolumeClaim.sparksubmitvol.mount.readOnly=false \
--conf spark.kubernetes.driver.volumes.persistentVolumeClaim.sparksubmitvol.mount.path=/spill_local \
--conf spark.kubernetes.driver.volumes.persistentVolumeClaim.sparksubmitvol.options.claimName=sparksubmitvol-claim \

источник

14:09пожаловаться #14

Oleg Ilinsky in Data Engineers

volume read-write-many

источник

14:09пожаловаться #15

Oleg Ilinsky in Data Engineers

Oleg Ilinsky

20/12/09 11:07:13 ERROR Utils: Uncaught exception in thread kubernetes-executor-snapshots-subscribers-1
java.util.NoSuchElementException: key not found: persistentVolumeClaim.sparksubmitvol.options.claimName

конфиг вот такой:

--conf spark.kubernetes.executor.volumes.persistentVolumeClaim.sparksubmitvol.mount.path=/spill_local \
--conf spark.kubernetes.executor.volumes.persistentVolumeClaim.sparksubmitvol.mount.readOnly=false \
--conf spark.kubernetes.driver.volumes.persistentVolumeClaim.sparksubmitvol.mount.path=/spill_local \
--conf spark.kubernetes.driver.volumes.persistentVolumeClaim.sparksubmitvol.options.claimName=sparksubmitvol-claim \

ну вроде ошибку заборол, но пока не понятно, пишутся ли туда промежуточные данные или нет

источник

17:51пожаловаться #16

K S in Data Engineers

Народ, посоветуйте или отговорите меня от дистрибутива Hadoop типа plain vanilla hadoop vs Cloudera Hadoop etc

источник

18:21пожаловаться #17

K S in Data Engineers

Мне достался в наследство полуработающий plain vanilla HDFS v 3.1.1, который доставляет очень мало удовольствия. Хотелось бы услышать аргументы в пользу перехода на что то более приятное .

источник

18:24пожаловаться #18

Mikhail Epikhin in Data Engineers

так а какие проблемы? что простой переход позволит улучшить?

источник

18:25пожаловаться #19

K S in Data Engineers

Ну например я видел, что в cloudera больше разных примочек типа балансировка дискового пространства или нахождение больших или маленьких файлов

источник

18:26пожаловаться #20