Size: a a a

2019 December 04

ДП

Даниил Пилипенко in Data Engineers
Код программы
источник

ДП

Даниил Пилипенко in Data Engineers
Вот очередной результат:

19/12/04 07:53:41 ERROR yarn.Client: Application diagnostics message: Max number of executor failures (3) reached
Exception in thread "main" org.apache.spark.SparkException: Application application_1575369361722_0009 finished with failed status


А если конкретнее, то:

AM Container for appattempt_1575369361722_0009_000001 exited with exitCode: 11
Failing this attempt.Diagnostics: Exception from container-launch.
Container id: container_1575369361722_0009_01_000001
Exit code: 11
Stack trace: ExitCodeException exitCode=11:
источник

ME

Max Efremov in Data Engineers
Может на hdfs положить результат проще будет?
источник

ДП

Даниил Пилипенко in Data Engineers
Кладу на HDFS как раз. Там даже папочка появляется
источник

I

Igor in Data Engineers
Всем привет! Извиняюсь за глупый вопрос, но как в Zeppellin устанавливать пакеты? сейчас он у меня даже pyspark не видит
источник

R

Rogoley in Data Engineers
Igor
Всем привет! Извиняюсь за глупый вопрос, но как в Zeppellin устанавливать пакеты? сейчас он у меня даже pyspark не видит
На сайте проекта есть прям хороший туториал
источник

I

Igor in Data Engineers
Rogoley
На сайте проекта есть прям хороший туториал
у меня цеппелин в докере развернут. Там про такое есть?
источник

DZ

Dmitry Zuev in Data Engineers
А какая разница?
источник

R

Rogoley in Data Engineers
Igor
у меня цеппелин в докере развернут. Там про такое есть?
А в чем разница?
источник

I

Igor in Data Engineers
Dmitry Zuev
А какая разница?
идемпотентность при перезапуске контейнера - всё, что было установлено во время работы руками, сотрется при перезапуске. Или там питоновские модули из директории монтируются?
источник

DZ

Dmitry Zuev in Data Engineers
Ой вей
источник

DZ

Dmitry Zuev in Data Engineers
Мы тут не умственноотсталые
источник

DZ

Dmitry Zuev in Data Engineers
Делай через сборку очевидно
источник

PA

Polina Azarova in Data Engineers
Igor
Всем привет! Извиняюсь за глупый вопрос, но как в Zeppellin устанавливать пакеты? сейчас он у меня даже pyspark не видит
что значит не видит? пакет установлен, но не работает?
можно потыкать configuration в вебинтерфейсе
источник

PA

Polina Azarova in Data Engineers
порестартить интерпретатор
источник

I

Igor in Data Engineers
Dmitry Zuev
Делай через сборку очевидно
под каждое требование образ пересобирать?
источник

DZ

Dmitry Zuev in Data Engineers
А в чем проблема?
источник

DZ

Dmitry Zuev in Data Engineers
Ну положи конфиг какой-нибудь, если в докерфайл неохота пускать
источник

I

Igor in Data Engineers
в том, что это делать кому-то надо. причем, этот кто-то обычно админ, который не хочет, чтоб его лишний раз дергали для установки 1 нового пакета. Если он нужен разрабам, то им же и нужен инструмент их установки. Как устоится набор пакетов, тогда может и запихну это в докерфайл
источник

DZ

Dmitry Zuev in Data Engineers
Ну не делайте
источник