Size: a a a

2019 November 07

VE

Vladimir E. in Data Engineers
Чтоб сам добавлял или апдейтил схемы
источник

VE

Vladimir E. in Data Engineers
может Atlas такое может?
источник

AZ

Anton Zadorozhniy in Data Engineers
Vladimir E.
может Atlas такое может?
по HDFS нет (надо самому краулера написать), есть Atlas Hive hook который может из хайва все вытащить
источник

VE

Vladimir E. in Data Engineers
А вообще обычно кто ответственен за синхронизацию метадат с хайвом, дата инженеры?
То есть вот например ктот взял создал новую папка на HDFS с parquet из спарка, кафки или типа того.
источник

VE

Vladimir E. in Data Engineers
и вот например забыли создать хайв таблицу, а потом и про папку забыли
источник

VE

Vladimir E. in Data Engineers
кому по рукам дают обычно в таком случае?)
источник

A

Alex in Data Engineers
создал и создал =) раз не зарегал нигде, то значит не надо никому
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
будет больно и дорого (гугл не хочет чтобы вы съезжали), лучший способ который мне известен - экспорт в авро в GCS и уже забирать оттуда
Мы такое практикуем ежедневно
источник

K

KrivdaTheTriewe in Data Engineers
Работает
источник

K

KrivdaTheTriewe in Data Engineers
Старый Хрыч
спадёт, если сейчас у пары компаний эксперимент провалиться, то потом можно ждать отдых от идиотизма
Мне кажется вам все таки придётся начать читать документацию
источник

VE

Vladimir E. in Data Engineers
Alex
создал и создал =) раз не зарегал нигде, то значит не надо никому
ну с точки зрения data governance это очень плохая практика, например что если нужно проверить на соответсвие GDPR/CCPA
источник

СХ

Старый Хрыч in Data Engineers
KrivdaTheTriewe
Мне кажется вам все таки придётся начать читать документацию
🙄боюсь  меня был целый кластер этого ужаса и чего не коснись было в  когда-нибудь починим
источник

K

KrivdaTheTriewe in Data Engineers
Старый Хрыч
🙄боюсь  меня был целый кластер этого ужаса и чего не коснись было в  когда-нибудь починим
И документацию таки прочтёте Наконец-то
источник

GP

Grigory Pomadchin in Data Engineers
Старый Хрыч
🙄боюсь  меня был целый кластер этого ужаса и чего не коснись было в  когда-нибудь починим
у тебя истории постоянно - то пориамиисты странные то ещё что
источник

GP

Grigory Pomadchin in Data Engineers
вон Дима дело советует
источник

VE

Vladimir E. in Data Engineers
все дата ассеты должны быть задокументированы гдет, и постоянно проверяться а не появилось ли там PII информация
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Мы такое практикуем ежедневно
Я не говорю что не работает, просто не бесплатно и оверхед
источник

AZ

Anton Zadorozhniy in Data Engineers
Vladimir E.
кому по рукам дают обычно в таком случае?)
Кто-то не может взять и просто так создать директорию :)
источник

VE

Vladimir E. in Data Engineers
Anton Zadorozhniy
Кто-то не может взять и просто так создать директорию :)
да ну, кучу раз сами так делали на PoC :D
источник

AZ

Anton Zadorozhniy in Data Engineers
Vladimir E.
да ну, кучу раз сами так делали на PoC :D
Я имею в виду что на зарегулированной системе это просто так невозможно
источник