Телеграмм чат группы proKafka страница 1227

Смотрите, коллеги, просто моя профдеформация такова, что я до того как прийти в Java бэкенд, лет 10 занимался ERP системами
и для меня нового ничего в потоковой архитектуре нет
в любой нормальной учётной системе с 80х годов прошлого века есть Ledger, он же append-only лог
и есть таблицы, обновляющиеся по мере добавления зависей в Ledger . Нужно увидеть баланс по счёту? -- быстро берём уже посчитанный

Это очень классный паттерн, его внедрение преобразует целые организации

Но

в случае ERP систем вся эта история живёт в RDBMS

В кафке такого я бы делать не рискнул по целому ряду причин

источник

12:54пожаловаться #4

Ivan Ponomarev in pro.kafka

хотя внешне, с высоты птичьего полёта, всё выглядит также
лог->stream processing->cache

источник

12:55пожаловаться #5

Nikolay in pro.kafka

Так Кафка - лог из rdbms. Поэтому они и похоже в такой формулировке. И у оракла есть лог и у постгресс

источник

12:56пожаловаться #6

Nikolay in pro.kafka

Лог только удаляется. И Кафка log файлы чистит.

источник

12:58пожаловаться #7

Ivan Ponomarev in pro.kafka

Nikolay

Так Кафка - лог из rdbms. Поэтому они и похоже в такой формулировке. И у оракла есть лог и у постгресс

Да, но это --- не ERP-шный Ledger

ERP-шный Ledger хранится вечно, над ним не нависает retention

В ERP-шный Ledger можно добавить новые поля и пересчитать задним числом, т. е. "обогатить" его в процессе развития системы

Наконец, запись в ERP-шный Ledger и в кэш всегда происходит в одной атомарной транзакции, чего мы не имеем с Kafka+whatever is your cache

источник

12:59пожаловаться #8

Nikolay in pro.kafka

Можно хранить весь стэйт в виде лога и при необходимости ( перезагрузок ) его читать , но это может стать очень долгим процессом и система просто не подниматься

источник

13:00пожаловаться #9

Nikolay in pro.kafka

Атомарность можно прикрутить средствам Кеша.

источник

13:01пожаловаться #10

Ivan Ponomarev in pro.kafka

Nikolay

Ну да. Вот я, думая обо всём этом, и пришёл к такому выводу.

что если задача, которую вы решаете, допускает перечитывания лишь "хвоста" лога фиксированной длины от "головы", то это и есть кейс для потоковых систем

а где надо хранить всё от "начала времён" как зеницу ока, там -- пока ещё нет.

источник

13:02пожаловаться #11

Ivan Ponomarev in pro.kafka

Nikolay

Атомарность можно прикрутить средствам Кеша.

прикрутить-то всё можно, вопрос, насколько прочно оно будет держаться 😁

источник

13:03пожаловаться #12

Nikolay in pro.kafka

А зачем вам лог тогда . Вы можете в кэше держать стэйт и перечитывать его. Опять же это redis + персистент к нему

источник

13:08пожаловаться #13

Ivan Ponomarev in pro.kafka

Nikolay

А зачем вам лог тогда . Вы можете в кэше держать стэйт и перечитывать его. Опять же это redis + персистент к нему

Как это зачем лог? А если мы ошиблись в расчётах? А если поменялись требования, и считать надо по-другому? А если мы видим, что сумма некорректная, и нам надо расследование провести, почему она именно такая?

источник

13:09пожаловаться #14

Ivan Ponomarev in pro.kafka

В общем.

Data Streaming -- это очень круто, я уверен, что эта штука потеснит многие существующие решения

Но есть ли у Data Streaming границы применимости? И какие они?

Я попытался сформулировать некоторый критерий, но пока не услышал, чтобы кто-то сказал: "да, я тоже вижу проблему именно так". Видимо, проблему все видят очень по-разному.

источник

13:11пожаловаться #15

Nikolay in pro.kafka

Какие решения она потеснит ? Базы данных как есть . Так и будут . И ерп на кафке тоже никто разрабатывать не будет.

источник

13:17пожаловаться #16

Ivan Ponomarev in pro.kafka

Nikolay

как знать, как знать 🤔

источник

13:18пожаловаться #17

Nikolay in pro.kafka

Ну ерп точно никто не будет разрабатывать на кафке. Она не для этого. В ней нету ни delete, ни get по ключу. И acid своеобразный. Без этого для ерп никак

источник

13:21пожаловаться #18

Ivan Ponomarev in pro.kafka

Nikolay

Не, опять немного не про то. Я не говорю о "голой кафке". И ERP тоже не на голом ledger живёт, хоть у него есть ledger, но всё построено вокруг ledger! Имеется в виду архитектура Kafka + Kafka Streams + база данных/кэш. Естествено, голая кафка без get/delete сама по себе мало чего может, это ёжику понятно.

источник

13:24пожаловаться #19

Ivan Ponomarev in pro.kafka

(замените Kafka Streams в предыдущем сообщении на свой любимый фреймворк потоковой обработки)

источник

13:25пожаловаться #20