Size: a a a

2021 October 17

NF

Nikolai Fominykh in Data Engineers
Если историческую дату нужно прогружать регулярно - то это обычный даг. Насколько помню, в airflow можно запустить даг с параметром, когда это требуется.

Количество тасок - так себе метрика. Можно перепутать airflow с draw.io и выбрать такую единицу гранулярности, что тасок будет под миллион.
источник

AK

Aliaksandr Kokhna in Data Engineers
Когда у вас 100500 джобов и куча фактовых, которые постоянно дорабатываются, Прогрузка истории обычное дело, как прогрузить только то что нужно а не весь Даг? В аирфлоу
источник

AK

Aliaksandr Kokhna in Data Engineers
Понятно что если 100 джобов на весь етл то можно перегружать все за день по 10 раз
источник

NN

No Name in Data Engineers
Ну таски же точно можно отдельно перезапустить. Другое дело, что, наверное, если у тебя оч много джобов, и каждый день это надо делать, то это может быть неудобным, но, мне кажется, если у вас реально настолько часто происходят изменения, то у вас какая-то фигня с процессами или самими пайплайнами (но, конечно, могу ошибаться, мало ли какие особенности)
источник

AK

Aliaksandr Kokhna in Data Engineers
Ну таск отдельно можно, но нужно же и зависимости
источник

NN

No Name in Data Engineers
Ну так они по цепочке дальше пойдут сами пересчитываться
источник

AK

Aliaksandr Kokhna in Data Engineers
Ну я в принципе не верю что в етл, не нужно периодически работать с историческими данными и перегружать, не каждый день конечно, но в принципе часто я бы сказал
источник

NN

No Name in Data Engineers
Нужно, конечно, но для этого нам эйрфлоу оказалось достаточно.
источник

AK

Aliaksandr Kokhna in Data Engineers
👍
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ну кажется это просто сенсорами всё делается, нет?
источник

K

KrivdaTheTriewe in Data Engineers
бекфил
источник

MM

Mikhail Mariufich in Data Engineers
А вы случайно не хотели все ваши такси в один даг положить?
источник

ПФ

Паша Финкельштейн... in Data Engineers
Кажется так и сделали. Почему-то
источник

C

Combot in Data Engineers
Emir has been banned! Reason: CAS ban.
источник

C

Combot in Data Engineers
Emir has been banned! Reason: CAS ban.
источник

A

Aleksey in Data Engineers
кмк проблема Atlas в том, что ему нужен HBase для работы (что требует достаточно громоздкой инсталляции). Ну и Data Catalog не только для бизнеса, но для ИТ.
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Атласу не нужен hbase 😳
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
О блин, нужен
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Мне казалось, ему только солр нужен был
источник

A

Aleksey in Data Engineers
👍 еще и солр )) в общем тяжелый малый
источник