Size: a a a

2020 September 22

T

T in Data Engineers
Не плохое решение для не больших команд
источник

N

Nikita Blagodarnyy in Data Engineers
Alexey Evdokimov
эту хрень можно на s3 натравить, чтобы она собрала саммари по ассетам?
из коробки вроде нет, но там есть интерфейс, который можно реализовать под любой ассет.
источник

AE

Alexey Evdokimov in Data Engineers
у меня вот пара десятков бакетов в с3, куда сложено сколько-то десятков терабайт не очень хорошо структурированных данных в паркетах и цсв. сатанистами в доках описано меньше половины. вопрос, как каталогизировать оставшееся?

а то даже непонятно, что уже можно грохнуть, а что нет. руками просматривать это сдохнуть можно
источник

T

T in Data Engineers
Alexey Evdokimov
у меня вот пара десятков бакетов в с3, куда сложено сколько-то десятков терабайт не очень хорошо структурированных данных в паркетах и цсв. сатанистами в доках описано меньше половины. вопрос, как каталогизировать оставшееся?

а то даже непонятно, что уже можно грохнуть, а что нет. руками просматривать это сдохнуть можно
https://engineering.shopify.com/blogs/engineering/solving-data-discovery-challenges-shopify в shopify вот такую штуку запилили для таких проблем
источник

AZ

Anton Zadorozhniy in Data Engineers
мб кто на российских облаках сидит, данные в местном С3, что-то в аренадате, что-то в КХ, как вы катологизируете чтобы пользователям и аудиторам показывать?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
компонент где описывается связь физических данных с бизнесом: метаданные, бизнес-глоссарии, lineage; часто с социальным компонентом или такой интеграцией, с профайлером и какими-то фичами по качеству
Помните найти инвестора , сделаем датакаталог хороший
источник

K

KrivdaTheTriewe in Data Engineers
Кросс облако
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Помните найти инвестора , сделаем датакаталог хороший
я уже два сделал, но для клиентов а не инвесторов) мне для другого нужно
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
я уже два сделал, но для клиентов а не инвесторов) мне для другого нужно
Расскажите
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Расскажите
маркет рисерч, у меня в аналитикопс есть зеркало датакаталога (для сатанистов), я написал две интеграции для разных клиентов, интересно какие еще нужно написать
источник

N

Nikita Blagodarnyy in Data Engineers
T
Не плохое решение для не больших команд
и че, саентисты сидят пишут запросы к neo4j и смотрят на прыгающие шарики?
источник

T

T in Data Engineers
Nikita Blagodarnyy
и че, саентисты сидят пишут запросы к neo4j и смотрят на прыгающие шарики?
Эт больше de сидят и смотрят сатанисты пока работают с маленьким сабсетом
источник

N

Nikita Blagodarnyy in Data Engineers
в амундсене если запилить обзор всего каталога + имеющийся поиск, это уже покроет процентов 80% потребностей
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Blagodarnyy
и че, саентисты сидят пишут запросы к neo4j и смотрят на прыгающие шарики?
я видел как сатанисты налабали морду к нео на шайни, правда для другого кейса, но вполне могут
источник

N

Nikita Blagodarnyy in Data Engineers
Nikita Blagodarnyy
в амундсене если запилить обзор всего каталога + имеющийся поиск, это уже покроет процентов 80% потребностей
все эти прерасные метрики качества данных сто лет никому не впились.
источник

OA

Oleksandr Averchenko in Data Engineers
Nikita Blagodarnyy
все эти прерасные метрики качества данных сто лет никому не впились.
Где то порвалась ни одна команда дата кволити инженегров.
источник

N

Nikita Blagodarnyy in Data Engineers
Oleksandr Averchenko
Где то порвалась ни одна команда дата кволити инженегров.
о, это что-то новенькое. что делают эти почтенные господа?
источник

OA

Oleksandr Averchenko in Data Engineers
Nikita Blagodarnyy
о, это что-то новенькое. что делают эти почтенные господа?
Мониторят качество данных в этом вашем тырпрайзе.
Смотрят откуда лезет мусор. Майнят мусор на инсайты.
Обмазываются мусором. Реконсилируют мусор. Чтобы поддерживать правильный уровень сигнал шум. Фиксят руткозы.
Нужны собственно там где ошибка будет стоит денег.
источник

TT

Tsh Tsh in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
“slow day for our CDO”
источник