Если историческую дату нужно прогружать регулярно - то это обычный даг. Насколько помню, в airflow можно запустить даг с параметром, когда это требуется.
Количество тасок - так себе метрика. Можно перепутать airflow с draw.io и выбрать такую единицу гранулярности, что тасок будет под миллион.
Когда у вас 100500 джобов и куча фактовых, которые постоянно дорабатываются, Прогрузка истории обычное дело, как прогрузить только то что нужно а не весь Даг? В аирфлоу
Ну таски же точно можно отдельно перезапустить. Другое дело, что, наверное, если у тебя оч много джобов, и каждый день это надо делать, то это может быть неудобным, но, мне кажется, если у вас реально настолько часто происходят изменения, то у вас какая-то фигня с процессами или самими пайплайнами (но, конечно, могу ошибаться, мало ли какие особенности)
Ну я в принципе не верю что в етл, не нужно периодически работать с историческими данными и перегружать, не каждый день конечно, но в принципе часто я бы сказал
кмк проблема Atlas в том, что ему нужен HBase для работы (что требует достаточно громоздкой инсталляции). Ну и Data Catalog не только для бизнеса, но для ИТ.