Size: a a a

2020 January 30

AZ

Anton Zadorozhniy in Data Engineers
Андрей Жуков
запустить спарк на кубах, сложить все в с3 и гордиться, что у тебя серверлесс!
так серверлесс это же не кубы и с3, это менеджмент и (даже больше) финансовая модель
источник

АЖ

Андрей Жуков in Data Engineers
Anton Zadorozhniy
так серверлесс это же не кубы и с3, это менеджмент и (даже больше) финансовая модель
поэтому и колобок
источник

AZ

Anton Zadorozhniy in Data Engineers
Андрей Жуков
поэтому и колобок
я видимо не понимаю молодежный жаргон.. а как вы симулировать bigquery/redshift spectrum хотите?
источник

АЖ

Андрей Жуков in Data Engineers
Anton Zadorozhniy
я видимо не понимаю молодежный жаргон.. а как вы симулировать bigquery/redshift spectrum хотите?
Колобок - это стикер :) а стикер  потому что я глумлюсь
источник

ME

Max Efremov in Data Engineers
Андрей Жуков
не, ну это и на спарк можно натянуть
AWS Glue!)
источник

Ж

Жмака in Data Engineers
Всем привет. Нужна помощь. Запускаю spark-submit  локально на мастер ноде aws emr. Все валится. В логах пишет все время:org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /hbase/hbaseid
источник

Ж

Жмака in Data Engineers
Джоб должен подключаться к hbase. Судя по логам пытается локально на экзекьбторе найти зукипер :20/01/30 16:18:55 WARN ReadOnlyZKClient: 0x334f9b75 to localhost:2181 failed for get of /hbase/hbaseid, code = CONNECTIONLOSS, retries = 30, give up
источник

Ж

Жмака in Data Engineers
Запустил снова спарк сабмит и в комманде прописал в - - files все xml конфиги через запятую
источник

GP

Grigory Pomadchin in Data Engineers
очевидно, что чет не так с HBase конфигами)
источник

Ж

Жмака in Data Engineers
Там зукипер кворум верно прописан
источник

AS

Andrey Smirnov in Data Engineers
Жмака
Джоб должен подключаться к hbase. Судя по логам пытается локально на экзекьбторе найти зукипер :20/01/30 16:18:55 WARN ReadOnlyZKClient: 0x334f9b75 to localhost:2181 failed for get of /hbase/hbaseid, code = CONNECTIONLOSS, retries = 30, give up
точно должно быть localhost?
источник

Ж

Жмака in Data Engineers
Нет. В том то и загвоздка. Что он стучится локально к зукиперу которого на кор нодах соответственно нет. Не пойму где прошляпил
источник

DG

Denis Gabaydulin in Data Engineers
Там вроде какой то параметр был, чтобы указать zk quorum, если он указан, значит где-то теряется. Могу предположить, что в executor при старте надо добавить конфиг в cp.
источник

Ж

Жмака in Data Engineers
Какой параметр? Где и как добавить?
источник

RI

Rustam Iksanov in Data Engineers
Смотри zk quorum
источник

DG

Denis Gabaydulin in Data Engineers
hbase.zookeeper.quorum. Он должен вообще браться из env в кластере. Например в хадупе его надо прописать на всех нодах кластера а hbase-site.xml.
источник

Ж

Жмака in Data Engineers
Он прописан в hbase-site.xml и даже в hive-site.xml
источник

S

Sergey in Data Engineers
А как в Flink подсунуть джобе значение hbase.zookeeper.qourum? Пока только в ресурсах джобы получается xml файл держать..получается что адрес захардкожен в jar-нике
источник
2020 January 31

DG

Denis Gabaydulin in Data Engineers
Жмака
Он прописан в hbase-site.xml и даже в hive-site.xml
Значит этот конфиг "не виден" executor, посмотрите попадает ли он в cp через ui, например. А если виден, тогда он где-то перетирается.
источник

Ж

Жмака in Data Engineers
Denis Gabaydulin
Значит этот конфиг "не виден" executor, посмотрите попадает ли он в cp через ui, например. А если виден, тогда он где-то перетирается.
Вопрос как проверить? 🤔
источник