Size: a a a

2021 March 26

s

skatromb in Data Engineers
Anton Zadorozhniy
Job security!
Ну, лучше так, чем job failure. Но да, костыль
источник

AD

Apache DOG™ in Data Engineers
Pavel
Я из-за этой поеботы с версиями скалы ооказался писать джобы флинка на скале. Это реально жесть была на стадии PoC. Тестовая джоба через пару месяцев просто отказалась взлетать, че-то там обнрвилось, и все зависимости по пизде пошли
и остальные  версии тоже нужно бампать условным стьюартом, хватит плодить лигасню
источник

AZ

Anton Zadorozhniy in Data Engineers
skatromb
Ну, лучше так, чем job failure. Но да, костыль
да это нормальный вариант, особенно если масштаб не такой большой чтобы держать свои форки и сборки основных зависимостей.. я к тому что об этом мало думают формируя команды и считая бюджеты
источник

AZ

Anton Zadorozhniy in Data Engineers
"зачем нам платить, все же бесплатное?" 😊
источник

D

Dmitry in Data Engineers
всем привет, я тут вчера спрашивал как timeout spark для jdbc задать, подсказали что в .option можно queryTimeout прописать. попробовал, но не пойму как это работает. прописал 1200 (секунд). вместо 20 минут более двух часов провис, но выдал новую ошибку
com.mysql.cj.jdbc.exceptions.MySQLTimeoutException: Statement cancelled due to timeout or client request
т.е. timeot похоже работает, но странное время. ок, поставил 400 - через пару минут прибил квери, поставил 900 - через 7 минут прибил. не пойму как это работает
источник

R

Roman in Data Engineers
skatromb
А если фиксировать все версии зависимостей?
Окружение может обновиться. Например у вас что - то по дефодту пмхается в класс пасс на запуске. И вот это стандартное взяли и обновили и у вас появился конфликт.
источник

R

Roman in Data Engineers
Ветеран Андреич
Ребят, привет. Кто может рассказать в чем может быть проблема. Мне говорится об ошибке во время запуска моего mapreduce Exception in thread "main" java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.orc.mapreduce.OrcOutputFormat not found, хотя я открываю джарник руками и вижу этот класс в этом пакете. Если я делаю export HADOOP_CLASSPATH этой либы из зависимостей, то работает
Ддарник с вашим кодом, который вы деплоите?
Как деплоите?
источник

AS

Andrey Smirnov in Data Engineers
Andrey Bel
Всем привет, никто не знает  норм варик писать с флинка в редис юзая скалу 2.12?
у меня коннектор работал jedis но он под скалу 11 с 12 не пашет
а что за коннектор, там же jedis просто как грабли, что особенного  в этом коннекторе?
источник

AB

Andrey Bel in Data Engineers
Andrey Smirnov
а что за коннектор, там же jedis просто как грабли, что особенного  в этом коннекторе?
особенность в том что джедис не работает с скала 12
источник

ВА

Ветеран Андреич... in Data Engineers
Roman
Ддарник с вашим кодом, который вы деплоите?
Как деплоите?
Чтобы быть более конкретным. Зависимость orc-mapreduce.jar, если я включаю этот jar в HADOOP_CLASSPATH, то все работает, если собираю джарник со своей джобой и зависимостями (включая orc-mapreduce.jar), но не прописываю orc-mapreduce.jar в HADOOP_CLASSPATH, то не работает. Запускаю как обычную mapreduce задачу hadoop jar /opt/jar/export-items.jar packagename.JobName
источник

AS

Andrey Smirnov in Data Engineers
Andrey Bel
особенность в том что джедис не работает с скала 12
прикольно, это на каком jvm?
источник

R

Roman in Data Engineers
Anton Zadorozhniy
да это нормальный вариант, особенно если масштаб не такой большой чтобы держать свои форки и сборки основных зависимостей.. я к тому что об этом мало думают формируя команды и считая бюджеты
Это вообще большая проблема, потому что обычно люди, которые считают бюджет, живут в другом информационном пространстве. Более того многие разраьочтики тоже этого не понимают.
Я долго думал, как же это решается и понял,что особо никак. Вроде бы redhat в свое время так и взлетел, что брал на себя решение всех проблем с обновлениями и поддержкой и так далее. А до этого люди на местах сами собирали линукса с разным по и были проблемы с обновлениями. По сути клоудера, emr, хортон(r.i.p) тоже отчасти предлагают эту услугу, помимо удобство эксплуатация, утсанвоки, мониторинга и тд
источник

AB

Andrey Bel in Data Engineers
Andrey Smirnov
прикольно, это на каком jvm?
да хз, восьмая наверное давно не лазил
источник

AB

Andrey Bel in Data Engineers
Andrey Smirnov
прикольно, это на каком jvm?
а у тебя работает на свежей?
источник

AB

Andrey Bel in Data Engineers
я видел что в код была добавлена поддержка скала 12 но коннектор так и висит только для скала 11 в мавен централ
источник

AS

Andrey Smirnov in Data Engineers
Andrey Bel
а у тебя работает на свежей?
сейчас проверю, тот кусок что с редисом работает у нас до сих пор на 2.11
источник

AS

Andrey Smirnov in Data Engineers
Andrey Bel
особенность в том что джедис не работает с скала 12
проверил, работает на jvm 8 для скалы 2.12.10
источник

AB

Andrey Bel in Data Engineers
Andrey Smirnov
проверил, работает на jvm 8 для скалы 2.12.10
о круто спасибо!!
а у вас "org.apache.bahir" %% "flink-connector-redis" % "1.0",
или "org.apache.flink" %% "flink-connector-redis" % "1.0",
источник

AB

Andrey Bel in Data Engineers
?
источник

AS

Andrey Smirnov in Data Engineers
но я думаю что понимаю откуда проблема, разбирайтесь с sbt, как заставить его искать в репозиториях без указания версии scala

нет, я тестировал jedis, про него была речь в условии задачи :)
источник