Size: a a a

2020 August 29

K

KrivdaTheTriewe in Data Engineers
Ну то есть можно сделать полноценный запуск кода условно в пайчарме
источник

K

KrivdaTheTriewe in Data Engineers
Главное не забыть все в докер засунуть
источник

AZ

Anton Zadorozhniy in Data Engineers
Roman
А чем объективно он лучше?
Там даг и там даг,
Там можно кастомные экшены писать и там.
Я немного тыкал эирфлоу, не увидел каких - то киллер фич по сравнению с узи, но может я что - то упустил.
Они разные, зависит от вашей ситуации: если вы на гугле то конечно проще пользоваться клауд компоузером, но если у вас персистентные хадуп кластера и все стабильно , то порог входа в эйрфлоу будет довольно большим - он не умеет использовать хадупный компьют и сторадж, придётся переделать CD и так дальше
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Они разные, зависит от вашей ситуации: если вы на гугле то конечно проще пользоваться клауд компоузером, но если у вас персистентные хадуп кластера и все стабильно , то порог входа в эйрфлоу будет довольно большим - он не умеет использовать хадупный компьют и сторадж, придётся переделать CD и так дальше
А ози что, сильно умеет в случае если условный докер контейнер поднять ?
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
А ози что, сильно умеет в случае если условный докер контейнер поднять ?
Я не понял вопроса
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Я не понял вопроса
Я к тому , что из хадуповосвого компьюта ози умеет то :)
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Я к тому , что из хадуповосвого компьюта ози умеет то :)
YARN умеет, ему не нужно экзекьюторы скейлить через Celery или кубер
источник

A

Alex in Data Engineers
KrivdaTheTriewe
А ози что, сильно умеет в случае если условный докер контейнер поднять ?
Норм узи в контейнеры умеет :) умеет ярн, а для узи лишь проставить параметр окружения, вся локализация ресурсов и даже керберос взлетают
источник

A

Alex in Data Engineers
Гоняем питон в докер контейнерах на хадупе, через узи скедулим
источник

K

KrivdaTheTriewe in Data Engineers
Alex
Гоняем питон в докер контейнерах на хадупе, через узи скедулим
И xml пишите ?
источник

A

Alex in Data Engineers
Причём без проблем ты можешь держать контейнер базовый один, а на сабмите джобы только закинуть на hdfs ресурсы для выполнения

Ози их на старте все локализует, в бутстрап скрипте лишь запуститься остается
источник

K

KrivdaTheTriewe in Data Engineers
А тесты на даги?
источник

A

Alex in Data Engineers
Дагов нету на данный момент сложных, что нужно или через хью или если список разных контейнеров, то там уже чуть сложнее
источник

A

Alex in Data Engineers
А просто скрипт или нотебук заскедулить в разы проще на нем
источник

A

Alex in Data Engineers
Используем ещё databand.ai для дагов в данный момент, но не полностью закончили интеграцию
источник

AZ

Anton Zadorozhniy in Data Engineers
И хранение артефактов в HDFS, и логирование с метриками общее для всего, сплошные удобства
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну и даги можно на любом языке писать, благо типизированный XML легко порождать откуда угодно
источник

A

Alex in Data Engineers
Начинали они как обвязка над эирфлоу, но в части описания задач и тд нравится на порядок больше
источник

A

Alex in Data Engineers
И сохранение логов/выводов промежуточных и тд
источник

A

Alex in Data Engineers
Единственное что допилили свой апмастер и дописали интеграцию с ними
источник