Size: a a a

2021 October 25

AE

Alexey Evdokimov in Data Engineers
MR это некротехнология всё же. принципы может и объясняет, но напрямую её всё равно никто не будет юзать, а аналогии не всегда работают
источник

OI

Oleg Ivchenko in Data Engineers
Про NiFi много слышал. А можно немного мотивации?
источник

N

Nikita Blagodarnyy in Data Engineers
мотивации к чему?
источник

AZ

Anton Zadorozhniy in Data Engineers
описание бизнес-логики на всяких датафреймах и прочих DSL над обычными ЯП, все довольно быстро катится обратно к SQL
источник

G

Gleb in Data Engineers
Означает ли это, что эта профессия вымирает?
источник

AZ

Anton Zadorozhniy in Data Engineers
нет конечно
источник

G

Gleb in Data Engineers
Я тут просто совсем новичок (в роли ДИ), поэтому активно пытаюсь понять на чем фокусировать своё внимание
источник

AE

Alexey Evdokimov in Data Engineers
на своих конкретных задачах, за которые вам и платят бабло
источник

AE

Alexey Evdokimov in Data Engineers
ваш К.О.
источник

G

Gleb in Data Engineers
Это само собой) Но в свободное время по-немногу никто ведь не запрещает что-то изучать +- по теме
источник

D

Den in Data Engineers
подскажите, плз, как может выглядеть тестирование пайплайнов?
есть инструменты для автоматизации? бест практики, на что, вообще, обращать внимание при тестировании?

стек - hdfs, greenplum, все джобы - чисто sql с параметризацией
источник

D

Den in Data Engineers
если отбросить data quality, то для проверки логики - это ж чисто ручное написание скриптов? сравнить источник, сравнить готовые витринки.
источник

OI

Oleg Ivchenko in Data Engineers
Будет также Oracle
источник

OI

Oleg Ivchenko in Data Engineers
Ну т.е. почему именно он
источник

N

Nikita Blagodarnyy in Data Engineers
Серьезно?
источник

AZ

Anton Zadorozhniy in Data Engineers
основные ассерты автоматизировать можно, и дальше вы пишете просто в формате конфигурации
в качестве примера как это все может выглядеть в пределе - посмотрите на great expectations
источник

OI

Oleg Ivchenko in Data Engineers
Да, мы поднимем удаленный сервер и слушатели будут коннектиться к нему.
источник

AZ

Anton Zadorozhniy in Data Engineers
а почему не постгря?
источник

N

Nikita Blagodarnyy in Data Engineers
низкий порог входа, no code пайплайны, двигай кубики-получай результат, для простых задач более чем достаточно, куча проблем решена и протестирована, обстучал апи, сплитнул жысон, положил в кафку, получил премию. файлы таскать и роутить вообще одно удовольствие.
источник

N

Nikita Blagodarnyy in Data Engineers
ну если выучить select from group by having, то глобально пофигу. но учить оракл специфичные штуки смысла нет никакого, оракла кмк в живой природе практически не осталось, а в аналитике и подавно.
источник