Size: a a a

2019 November 07

VE

Vladimir E. in Data Engineers
а как часто встречаются такие зарегулированные системы? Это как то програмно ограничивается или просто best practice?
источник

AZ

Anton Zadorozhniy in Data Engineers
Либо эта директория часть пайплайна который прошёл по CD, либо это где-то в песочнице, где время жизни ограниченно и все аудируется
источник

AZ

Anton Zadorozhniy in Data Engineers
Vladimir E.
а как часто встречаются такие зарегулированные системы? Это как то програмно ограничивается или просто best practice?
В моей практике часто 😭
источник

ME

Max Efremov in Data Engineers
А подскажите, как с точки зрения data governance в амазоне строить даталейк? Кроме Lake Formation что там ещё используется?
источник

VE

Vladimir E. in Data Engineers
Max Efremov
А подскажите, как с точки зрения data governance в амазоне строить даталейк? Кроме Lake Formation что там ещё используется?
Да куча всего, или интересует именно нативный AWS?
источник

АЖ

Андрей Жуков in Data Engineers
Vladimir E.
а как часто встречаются такие зарегулированные системы? Это как то програмно ограничивается или просто best practice?
настроить-то просто, а вот чтобы руки сами себя били, придется полюбить керберос
источник

ME

Max Efremov in Data Engineers
Vladimir E.
Да куча всего, или интересует именно нативный AWS?
да. Уже есть какое-то подобие даталейка в S3, есть Glue каталоги, с ними работает афина, спарк джобы. Хочется всё это сделать красиво, по феншую)
источник

ME

Max Efremov in Data Engineers
Но не совсем понятно, куда копать. Lake Formation вроде поможет зарулить права к таблицам и колонкам этих таблиц, а вот всё остальное как организовать - не совсем понятно
источник

N

Nikita Blagodarnyy in Data Engineers
Vladimir E.
все дата ассеты должны быть задокументированы гдет, и постоянно проверяться а не появилось ли там PII информация
Вы таким путем до датастьюардов дойдете с владельцами информации и прочим DAMA DMBOK.
источник

AZ

Anton Zadorozhniy in Data Engineers
Max Efremov
Но не совсем понятно, куда копать. Lake Formation вроде поможет зарулить права к таблицам и колонкам этих таблиц, а вот всё остальное как организовать - не совсем понятно
я для клиента написал сервис который интегрируется с датакаталогами и генерирует политики для IAM, но это на уровне бакет/директория с EMRFS, колоночных или построчных политик там нет
источник

VE

Vladimir E. in Data Engineers
Nikita Blagodarnyy
Вы таким путем до датастьюардов дойдете с владельцами информации и прочим DAMA DMBOK.
конечно, мы на этом бизнес и строим :)
источник

N

Nikita Blagodarnyy in Data Engineers
И как? Много желающих выстраивается в очередь быть владельцами информации?
источник

ME

Max Efremov in Data Engineers
Anton Zadorozhniy
я для клиента написал сервис который интегрируется с датакаталогами и генерирует политики для IAM, но это на уровне бакет/директория с EMRFS, колоночных или построчных политик там нет
Возможно тоже что-то придётся написать, но пока смотрю на готовые решения, может помогут)
источник

VE

Vladimir E. in Data Engineers
Nikita Blagodarnyy
И как? Много желающих выстраивается в очередь быть владельцами информации?
А это уже не от нас зависит, мы софт продаём ☺️
источник

AZ

Anton Zadorozhniy in Data Engineers
Max Efremov
Возможно тоже что-то придётся написать, но пока смотрю на готовые решения, может помогут)
готовые решение это когда все в одной среде, например в датабрикс, если вы хотите быть гибкими - надо будет клеить вместе
источник

AZ

Anton Zadorozhniy in Data Engineers
например мой сервис для того клиента также интегрирован с EMR и генерирует SecurityConfiguration для нужных политик и поднимает кластер по запроу
источник

ME

Max Efremov in Data Engineers
Anton Zadorozhniy
готовые решение это когда все в одной среде, например в датабрикс, если вы хотите быть гибкими - надо будет клеить вместе
вроде для EMR можно Apache Ranger заюзать и ещё другие продукты апачи
источник

N

Nikita Blagodarnyy in Data Engineers
Vladimir E.
А это уже не от нас зависит, мы софт продаём ☺️
Умеете уже bash/python код в lineage разворачивать?
источник

AZ

Anton Zadorozhniy in Data Engineers
Max Efremov
вроде для EMR можно Apache Ranger заюзать и ещё другие продукты апачи
все можно, но залазить в кишки EMR  я не рекомендую, сложно будет сопровождать, мы стараемся его всегда рассматривать как сервис
источник

VE

Vladimir E. in Data Engineers
для lineage мы с Manta интегрируемся, но они вроде пока такое не умею
источник