Size: a a a

2021 April 09

ЕП

Евгений Погребняк... in Data Engineers
датабрикс это сразу несколько типов инструментов под одним интерфейсом?
источник

S

Stanislav in Data Engineers
А заканчивается все питоном и пг/вертикой
источник

AZ

Anton Zadorozhniy in Data Engineers
это как раз data lakes (или lakehouse, как они себя промоутят сейчас) платформа, а у вас под data lakes указаны два объектных стораджа, один сторадж для даталейков, и формат хранения данных
источник

ЕП

Евгений Погребняк... in Data Engineers
Лично мне была бы полезна картинка из 5-6 инструментов со связями и комментария "а потом наросла еще куча инструментов и почему это было кому-то нужно". Моя мечта )
источник

AZ

Anton Zadorozhniy in Data Engineers
если вы хотите нормально рассказывать архитектуру то надо рисовать не логотипы, а capability model, где пояснять что делают конкретные блоки, а потом уже имена рисовать
источник

AZ

Anton Zadorozhniy in Data Engineers
иначе получается что автор вообще не понимает что такое data lake, если смотреть на эту картинку
источник

ЕП

Евгений Погребняк... in Data Engineers
В моем случае даже читатель не понимает 😏 пошел гугглить capability model
источник

AZ

Anton Zadorozhniy in Data Engineers
грубо говоря вы берете ваш набор требований/пожеланий/мечт ваших пользователей и заказчиков, и формируете список того что вам нужно (безотносительно продуктов), а потом выбираете что нужно
источник

NN

No Name in Data Engineers
*схватил инсульт*
источник

NN

No Name in Data Engineers
2/3 вообще не знакомы, чисто стартапный клауд какой-то. И, чувствую, что большая часть инструментов оч узкие и сырые могут оказаться. Так можно кошмарный зоопарк нагородить и кучу легаси уже в первый год)
источник

ЕП

Евгений Погребняк... in Data Engineers
Я может очень глупый вопрос задам, но здесь предполагается, что слева генерится куча данных внутри или вне компании, к которым есть доступ, а далеко справа есть пользователь которому что-то от этих данных нужно?
источник

AZ

Anton Zadorozhniy in Data Engineers
нормальный вопрос, да, это вырезано из какого-то черновика (там опечатки даже есть), не обращайте внимания на детали
источник

AZ

Anton Zadorozhniy in Data Engineers
там не только пользователи, там в целом потребители - хранилища, витрины, всякие операционные системы для дата сервисов
источник

NN

No Name in Data Engineers
Народ, а кто-нибудь apache ignite пробовал поверх существующего hadoop кластера накручивать, какие подводные камни? Читал, что вроде как можно, и не нашел чёт никаких ругательных постов и комментов по теме, только сплошное восхваление про отличный буст.
источник

ЕП

Евгений Погребняк... in Data Engineers
Мне кажется в небольших проектах слева направо дистанция короткая и ее пытаются накрыть одним - двумя инструментами, а сложная архитектура уже в каком-то другом классе корпоративных систем, где разные команды за разные части отвечают
источник

AZ

Anton Zadorozhniy in Data Engineers
это вы верно подметили, сложные системы сложные, а простые - простые
источник

AZ

Anton Zadorozhniy in Data Engineers
смысл в рисовании функций (а не систем) под требования, а потом уже раскроить это по тому на чем бежать
источник

ЕП

Евгений Погребняк... in Data Engineers
А потом бац - из архитектуры больших компаний начинают предлагать что-то более мелким и они начинают бредить "лейк", "шина интграции" )
источник

ЕП

Евгений Погребняк... in Data Engineers
Меня беспокоит ситуация, когда из архитектуры сложных что-то прилетает в архитектуру простых и нет компетенций с этмм разобраться
источник

ЕП

Евгений Погребняк... in Data Engineers
А менеджмент уже хочет лейк )
источник