Size: a a a

2021 April 25

AZ

Anton Zadorozhniy in Data Engineers
Их задача - не проронив на пол переложить из источника в объектный сторадж/ базу данных/ очередь
источник

AZ

Anton Zadorozhniy in Data Engineers
Оркестрация джобов это другое, слушайте курс дальше)
источник

AZ

Anton Zadorozhniy in Data Engineers
Оркестраторов джобов очень много всяких, у меня был клиент который до сих пор пользуется на клауде Control-M (точнее у них мультиклауд и онпрем), и очень счастлив
источник

ЕП

Евгений Погребняк... in Data Engineers
Для несведущих - airflow упаковывает куски bash скриптов, а luigi - выстраивает цепь между тасками, которые задаются как код внутри классов python?
источник

ME

Max Efremov in Data Engineers
Хм, гугли про луиджи, но уже не помню основные отличия( У аирфлоу тоже питон основной, хотя можно и баш запускать, конечно
источник

ЕП

Евгений Погребняк... in Data Engineers
Prefect выглядит кстати очень интуитивно - вот тебе Task, вот тебе Flow, запускай. Спасибо за рекомендацию!
источник

PA

Panchenko Andrey in Data Engineers
в гугл облаке есть композер тот же аирфлоу
источник

ME

Max Efremov in Data Engineers
в AWS даже managed Airflow есть)
источник

PA

Panchenko Andrey in Data Engineers
ну так в гугле такое же) тоже менеджед
источник

ЕП

Евгений Погребняк... in Data Engineers
Да, спасиб, почитал доки луиджи, правда немного погряз в параметрах и всяких CopyToTable.
источник

ЕП

Евгений Погребняк... in Data Engineers
То есть airflow - более распространенный? )
источник

PA

Panchenko Andrey in Data Engineers
хм ну он так скажем достаточно распространен, можете посмотерть на вакансии DE во многих он есть.
Тоже пайтон чистый, тоже понятен.
источник

ЕП

Евгений Погребняк... in Data Engineers
Спасиб! попробую запилить на prefect, он выглядит самым интуитивным по синтакису, дальше в стороны airflow или luigi
источник

PA

Panchenko Andrey in Data Engineers
но я бы на вашем месте смотрел на размеры комьюнити, кол-во звезд на гите и на кол-во релизов, ну и конечно на качество документации
источник

PA

Panchenko Andrey in Data Engineers
к тому же вот вам еще один маркер два гиганта (AWS, Google) облачных услуг сделали этот (Аирфлоу) ресурс селф менеджед.
источник

ME

Max Efremov in Data Engineers
там ещё узи жив, например)
источник

ME

Max Efremov in Data Engineers
Хотя он, наверное, ближе к хадупу и всему этому
источник

R

Roman in Data Engineers
Он завязан на хадупе, а хадуп умирает(-ер), так что не перспективно совсем смотреть в сторону узи. Хотя он оч хорош
источник

AZ

Anton Zadorozhniy in Data Engineers
Astronomer ещё делает managed airflow, очень хороший
источник

A

AE in Data Engineers
Расскажите почему хадуп умирает, правда интересно
источник