Под созвучием я подразумевал не сходство, а комплиментарность. Data lake -- большой массив данных структурированных очень разными способами, а цеттель способ построить между ними связи для организации которых нет готовой таксономии.
Впрочем, речь тогда о data governance. Просто в data mesh элементы data governance необходимы с самого начала, а в data lake ими можно до определенного момента пренебречь (но лучше не пренебрегать).
Сценарий использования примерно такой: наприме у вас может быть митинг на котором кто-то из коллег рассказывает об аномалиях на графиках построенных на основе данных из базы и вы через год найдя у себя в ящике поиском письмо хотите раскрутить всю цепочку: письмо - митинг - слайд - база данных - дашборд с данными
Причем от цеттеля тут сама идея лингка между произвольными данными. Напрмер между базой данных и презентацией, презентацией и встречей. Если создавать какой-то документ в конфе, то непонятно куда его класть (встречи, базы, аномалии?) и как потом искать.
Оно не работает без удержания в памяти этого графа (или очень крутой системы поиска, а ее в популярных решениях для цеттеля нет). Так что для коллективной БД не взлетит, нет возможности прописать ссылки. Технологически то любой конфлюенс такое может сделать.
@dphil вы недавно упоминали в контексте логов использование clickhouse + lighthouse. хотел поинтересоваться про опыт использования lighthouse. Потому что отзывов нигде интересных не видел + проект выглядит (полу-)заброшенным - свой форк имеете?
Так я же и личную базу не могу удержать в голове, я вот из сообщений выше сейчас набросал несколько карточек чтобы потом не вспоминать мучитально "что же за глевую кнгиу по big data мне в каком-то чате посоветовалаи"