Size: a a a

Архитектура ИТ-решений

2021 May 31

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Не вижу сходства ни в чём.
Да, для решения этой задачи можно задействовать компоненты data lake, но сами концепты совершенно разные.
источник

П

ПашМиш in Архитектура ИТ-решений
Под созвучием я подразумевал не сходство, а комплиментарность. Data lake -- большой массив данных структурированных очень разными способами, а цеттель способ построить между ними связи для организации которых нет готовой таксономии.
источник

П

ПашМиш in Архитектура ИТ-решений
И я тут говорю больше не про какой-то конкретный инструмент, а про способ организации когда данные линкуются непосредственно
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Тогда уж лучше говорить о data mesh. Особенно если мы имеем ввиду знания о данных.
источник

П

ПашМиш in Архитектура ИТ-решений
Спасибо, попробую углубиться в эту тему
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Впрочем, речь тогда о data governance. Просто в data mesh элементы data governance необходимы с самого начала, а в data lake ими можно до определенного момента пренебречь (но лучше не пренебрегать).
источник

П

ПашМиш in Архитектура ИТ-решений
Сценарий использования примерно такой: наприме у вас может быть митинг на котором кто-то из коллег рассказывает об аномалиях на графиках построенных на основе данных из базы и вы через год найдя у себя в ящике поиском письмо хотите раскрутить всю цепочку: письмо - митинг - слайд - база данных - дашборд с данными
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Очень крутая мысль.

И да, это можно отнести к data governance. А точнее к data quality (DQ), которая является частью data governance.

Цепочка такая: аномалии на графиках -> аномалии в данных -> DQ -> data governance

DQ - это процесс в рамках data governance.
источник

П

ПашМиш in Архитектура ИТ-решений
А что можно почитать про data governance?
источник

П

ПашМиш in Архитектура ИТ-решений
Причем от цеттеля тут сама идея лингка между произвольными данными. Напрмер между базой данных и презентацией, презентацией и встречей. Если создавать какой-то документ в конфе, то непонятно куда его класть (встречи, базы, аномалии?) и как потом искать.
источник

П

ПашМиш in Архитектура ИТ-решений
Спасибо
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Современного ничего. А так DAMA-DMBOK2
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science: Gorelik, Alex: 9781491931554: Amazon.com: Books
https://www.amazon.com/Enterprise-Big-Data-Lake-Delivering/dp/1491931558
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Вот эта книга must read с моей точки зрения. Там про таксономии, в том числе, здравые вещи написаны, как мне кажется.
источник

П

ПашМиш in Архитектура ИТ-решений
Спасибо, записал
источник

PD

Phil Delgyado in Архитектура ИТ-решений
Оно не работает без удержания в памяти этого графа (или очень крутой системы поиска, а ее в популярных решениях для цеттеля нет). Так что для коллективной БД не взлетит, нет возможности прописать ссылки.
Технологически то любой конфлюенс такое может сделать.
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
На фолксономии стоит обратить внимание
источник

AZ

Alexander Zaitsev in Архитектура ИТ-решений
@dphil вы недавно упоминали в контексте логов использование clickhouse + lighthouse. хотел поинтересоваться про опыт использования lighthouse. Потому что отзывов нигде интересных не видел + проект выглядит (полу-)заброшенным - свой форк имеете?
источник

PD

Phil Delgyado in Архитектура ИТ-решений
Зачем форк? Оно работает, логи показывает. Разработчику веб-морда к логам не нужна, а для службы мониторинга хватает
источник

П

ПашМиш in Архитектура ИТ-решений
Так я же и личную базу не могу удержать в голове, я вот из сообщений выше сейчас набросал несколько карточек чтобы потом не вспоминать мучитально "что же за глевую кнгиу по big data мне в каком-то чате посоветовалаи"
источник