Телеграмм чат группы data_architect страница 21

чтобы иметь в нем близкий к актуальному снепшот данных в системе, которая не имеет sql бд, и поэтому единственный вариант собрать снепшот - ловить эвенты, и апсертить по ключу в mysql

источник

21:51пожаловаться #9

Paul Golubev in Архитектура данных

Зачем снепшот близки к реалтайм, в мускуле?)

источник

21:51пожаловаться #10

Paul Golubev in Архитектура данных

Верхнеуровневая задача

источник

21:52пожаловаться #11

Denis Troyan in Архитектура данных

Paul Golubev

Зачем снепшот близки к реалтайм, в мускуле?)

показывать их в ui для мониторинга

источник

21:53пожаловаться #12

Paul Golubev in Архитектура данных

А чем кафка сама по себе не подходит тогда?

источник

21:53пожаловаться #13

Denis Troyan in Архитектура данных

вариант научить смотреть мониторинг в кафку - рассматривается, но как запасной

источник

21:53пожаловаться #14

Denis Troyan in Архитектура данных

потому что сейчас мониторинг уже смотрит в mysql

источник

21:53пожаловаться #15

Mitya Volodin in Архитектура данных

Denis Troyan

Есть необходимость в near-online вычитывать json tuple данные из кафки, процессить их немного и писать в mysql. Суть - выдергивать из логов эвенты, и сохранять их в подходящем для sql-запроса формате в mysql. Думаю попробовать spark streaming в java реализации. Кто знает про подводные камни, или может предложить вариант проще/лучше?

Flink

источник

21:54пожаловаться #16

Denis Troyan in Архитектура данных

и джойнить данные между кафкой и mysql - задача сложнее, чем внутри mysql

источник

21:54пожаловаться #17

Denis Troyan in Архитектура данных

Mitya Volodin

Flink

чем лучше spark streaming? (кроме того, что оно не микробатч)

источник

21:54пожаловаться #18

Mitya Volodin in Архитектура данных

Ну есть плюсы, есть минусы. Главный минус, наверное, это то, что проект молодой. В остальном он по скорости и возможностям on-line стриминг должен эффективней тянуть.

источник

21:56пожаловаться #19

Mitya Volodin in Архитектура данных

Я честно скажу, мы сейчас делаем проект, у нас они парой. Flink + Spark Streaming. Но второй - на всякий случай ))

источник

21:57пожаловаться #20