Size: a a a

2020 November 08

AZ

Anton Zadorozhniy in Data Engineers
Вы опишите вопрос конкретнее, что вы ищете и для какого кейса
источник

AZ

Anton Zadorozhniy in Data Engineers
Алексей Артамонов
PAM Authentication failed (asatest@::ffff:192.168.1.28): [PAM Error 7] Authentication failure

и все и не коннектится
А логин от этого пользователя работает?
источник

АА

Алексей Артамонов... in Data Engineers
ага, это я сразу проверил
источник

АА

Алексей Артамонов... in Data Engineers
@dartov вот зашел
источник

АА

Алексей Артамонов... in Data Engineers
@dartov в /etc/group
jupyterhub:x:1036:dbudnik, asatest прописал
источник

АА

Алексей Артамонов... in Data Engineers
сам юпитерхаб запускается от этого пользователя
источник

AZ

Anton Zadorozhniy in Data Engineers
Спросите вашего линуксового админа, мб на машине стоит какой-нибудь sssd и аутентификация не локальная
источник

АА

Алексей Артамонов... in Data Engineers
А можно сделать авторизацию через список пользователей?
источник

АА

Алексей Артамонов... in Data Engineers
Типа в файле конфига
источник

UD

Uncel Duk in Data Engineers
Алексей Артамонов
PAM Authentication failed (asatest@::ffff:192.168.1.28): [PAM Error 7] Authentication failure

и все и не коннектится
c.PAMAuthenticator.open_sessions = False
источник

G

Gev in Data Engineers
Anton Zadorozhniy
Вы опишите вопрос конкретнее, что вы ищете и для какого кейса
Все просто. Метаданные меняются. Поддерживать их актуальность в различных системах накладно. Нужен инструмент для аналитика, где ор бы мог актуализировать метаданные а системы опираться на эти актуальные данные. Атлас и навигатор видятся не плохим решением но я их не пробовал не знаю. Вопрос. Что лучше использовать на старте.
источник

AZ

Anton Zadorozhniy in Data Engineers
Gev
Все просто. Метаданные меняются. Поддерживать их актуальность в различных системах накладно. Нужен инструмент для аналитика, где ор бы мог актуализировать метаданные а системы опираться на эти актуальные данные. Атлас и навигатор видятся не плохим решением но я их не пробовал не знаю. Вопрос. Что лучше использовать на старте.
а какие метаданные, просто схемы/DDL, lineage, бизнес определения? какие задачи выполняет аналитик с этими метаданными?
источник

G

Gev in Data Engineers
Все перечисленное. Построение моделей по подготовке агрегатов и витрин
источник

G

Gev in Data Engineers
Меня больше интересуют ddl ну а аналитика все остальное
источник

AZ

Anton Zadorozhniy in Data Engineers
Gev
Все перечисленное. Построение моделей по подготовке агрегатов и витрин
все обычно стоит очень дорого, особенно в части изменения процессов; можно начать есть слона по частям, тем более что метаданные прямо деньги не приносят...
источник

AZ

Anton Zadorozhniy in Data Engineers
Gev
Меня больше интересуют ddl ну а аналитика все остальное
выглядит как data discovery, скорее всего вам хватит какого-то базового фреймворка вроде lyft amundsen, главное чтобы по типам дата ассетов было с вами совместимо
источник

AZ

Anton Zadorozhniy in Data Engineers
где у вас данные хранятся, в одном хранилище или как-то распределенно?
источник

AZ

Anton Zadorozhniy in Data Engineers
так вообще это широкая отрасль, от кучи коммерческих продуктов (water line, alation), есть неплохие открытые фреймворки (атлас упомянули, он прекрасен в своей мощи), ну и довольно часто это какие-то инхаус решения, которые могут быть проще в написании чем адоптация продукта или фреймворка
источник

G

Gev in Data Engineers
Системы пока две - hadoop hdfs/hive и postgresql
Структура хранения не сложная. В целом понятно - пока не попробуешь не поймешь. Вопрос то какраз в том, а что проще вводить в эксплуатацию. Если есть Cloudera может лучше смотреть в сторону navigator.  Как это ляжет на желание использовать метаданные в обеих системах.
источник

AZ

Anton Zadorozhniy in Data Engineers
Gev
Системы пока две - hadoop hdfs/hive и postgresql
Структура хранения не сложная. В целом понятно - пока не попробуешь не поймешь. Вопрос то какраз в том, а что проще вводить в эксплуатацию. Если есть Cloudera может лучше смотреть в сторону navigator.  Как это ляжет на желание использовать метаданные в обеих системах.
если навигатор у вас уже лицензирован то его точно стоит поставить и активировать, по-моему там можно кастомные метаданные определять и отгрузить туда схемы ваших таблиц в ПГ, я бы смотрел именно этот путь
источник