чтобы иметь в нем близкий к актуальному снепшот данных в системе, которая не имеет sql бд, и поэтому единственный вариант собрать снепшот - ловить эвенты, и апсертить по ключу в mysql
Есть необходимость в near-online вычитывать json tuple данные из кафки, процессить их немного и писать в mysql. Суть - выдергивать из логов эвенты, и сохранять их в подходящем для sql-запроса формате в mysql. Думаю попробовать spark streaming в java реализации. Кто знает про подводные камни, или может предложить вариант проще/лучше?
Ну есть плюсы, есть минусы. Главный минус, наверное, это то, что проект молодой. В остальном он по скорости и возможностям on-line стриминг должен эффективней тянуть.