Size: a a a

Архитектура данных

2019 July 05

PD

Phil Delgyado in Архитектура данных
А зачем тут батчи?
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
если у вас источник не стримит, то батчи еще как причем
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
ESB не в каждой компании есть, даже если компания думает, что он есть
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
обновлять раз в день таблицы для аналитики, тоже не стриминг
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
я уж молчу про консистентность данных между источником и хранилещем при стриминге с источника
источник

CO

Chern Oleksander in Архитектура данных
Vladislav 👻 Shishkov
раз в день обновлять таблицы?
А зачем постоянно?
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
очень часто вижу, как любят апдейтнуть сотку тысяч другую записей и без трансляции в ESB, а потом бизнес ломает голову, что не так...
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
Chern Oleksander
А зачем постоянно?
какие требование - такие и задачи, надо бизнесу видеть продажи с интервалом 1 минуту, будте любезны постоянно
источник

CO

Chern Oleksander in Архитектура данных
Vladislav 👻 Shishkov
какие требование - такие и задачи, надо бизнесу видеть продажи с интервалом 1 минуту, будте любезны постоянно
Опять же писал, что нужно разделять такие вещи, зачем постоянно грузить млн
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
почитайте про инкрементальную загрузку
источник

PD

Phil Delgyado in Архитектура данных
Vladislav 👻 Shishkov
если у вас источник не стримит, то батчи еще как причем
Так я бы тут строил вообще от Кафки.
Входящий поток в кафку, с него в oltp, bi и ml. На bi - вертика или CH, смотря какие требования.
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
как показывает практика, к источникам вас не допустят, а внедрять стриминг разрабам лень
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
но в целом да, согласен полностью, главное, чтобы умные разрабы руками не лазили в источник
источник

PD

Phil Delgyado in Архитектура данных
Вот-вот. Тем более что в Кафке можно и перезапросить источник
источник

CO

Chern Oleksander in Архитектура данных
Vladislav 👻 Shishkov
почитайте про инкрементальную загрузку
Спасибо, не слышал про такое
источник

SS

Sergey Sheremeta in Архитектура данных
купите Oracle Exadata - дорого, но все ваши хотелки покроет
источник

SS

Sergey Sheremeta in Архитектура данных
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
Phil Delgyado
Вот-вот. Тем более что в Кафке можно и перезапросить источник
это смотря как реализуют, не всегда на прод разрешают лазить и перезапрашивать милионы записей
источник

PG

Paul Golubev in Архитектура данных
Sergey Sheremeta
купите Oracle Exadata - дорого, но все ваши хотелки покроет
В случае с играми с требованиями минимального отклика даже Oracle inmemory option может быть медленным
источник

Д

Дана in Архитектура данных
Коллеги, есть вопрос по витрине. Планируется разработка витрины, в которой будет более 10 000 тысяч полей . У кого был опыт в создании такого datamart ? И как лучше ее реализовать?
источник