Size: a a a

2021 April 22

А

Андрей in Data Engineers
Ну если бы все было так просто) там система огорожена, и шагу не ступишь без согласия админов.
Сейчас ситуация такая - либо спарк валится с эксепшеном, пытаясь сьесть пустые файлы, либо некорректно читает данные в режиме совместимости
источник

e

er@essbase.ru in Data Engineers
Пробуете дырку критичным инцидентом.   Иначе ваш забор охраняет OOM?😜
источник

А

Андрей in Data Engineers
Ну если совсем хреново будет, то создадим баг и отправим тем же админам) а они пусть голову ломают
источник

S

Shadle in Data Engineers
Привет, подскажите, пожалуйста, как на AirFlow при помощи каких операторов можно реализовать такой ETL процесс
Есть 2 базы данных
при появлении новых строк в таблице базы А сделать ETL в базу Б
и чтобы постоянно пендинговал это событие
источник

S

Shadle in Data Engineers
Буду благодарен, если дадите ссылку на ресурс, где подобный пример разбирается
источник

ЕГ

Евгений Глотов... in Data Engineers
Можно например в питон-операторе поднять спарк-сессию и сделать spark.read.jdbc(url1).write.jdbc(url2)
источник

ЕГ

Евгений Глотов... in Data Engineers
Только вот появление новых строк в каждой базе по-разному может происходить и логгироваться
источник

S

Shadle in Data Engineers
Хорошо, попробую выянсить про сессии спарка
источник

ЕГ

Евгений Глотов... in Data Engineers
Можно просто селектом по ts добавления выбирать, это может быть неоптимально, но зато работоспособно на любой базе
источник

S

Shadle in Data Engineers
как реализовать можно стартовую точку ts?
источник

S

Shadle in Data Engineers
алгоритмически
источник

S

Shadle in Data Engineers
например когда сработал даг это точка отсчета?
источник

ЕГ

Евгений Глотов... in Data Engineers
Макрос Execution_date
источник

ЕГ

Евгений Глотов... in Data Engineers
Или макрос по текущему времени
источник

ME

Max Efremov in Data Engineers
Бд сенсор, наверное
источник

ME

Max Efremov in Data Engineers
Детектить как-то строки, дампить и инсёртить в другую базу
источник

S

Shadle in Data Engineers
источник

ME

Max Efremov in Data Engineers
Вообще, это в чат аирфлоу
источник

S

Shadle in Data Engineers
что то типо этого?
источник

S

Shadle in Data Engineers
Есть линк?
источник