Телеграмм чат группы itarchitect страница 1850

Сейчас с моими нагрузками справляется и rmq. Который дает мне внятную семантику "обработал". А не считал.

00:35пожаловаться

По ядру на партицию. С корутинами не работал. Но сомневаюсь, что они дают мне гарантии - позже считанное сообщение будет обработано строго позже, чем ранее считанное.

00:37пожаловаться

Ну, значит нагрузки низкие, можно и по одной записи читать и даже fsync ждать. Впрочем, на rmq ты гарантий не получишь вообще

00:37пожаловаться

Leonid Vygovskiy

Если тебе важен порядок, то ты не можешь обработать сообщение в пачке, если раньше был сбой. И тут тебе никакая очередь не поможет, включая rmq.

00:39пожаловаться

Phil Delgyado

Ну, а какие варианты для лог-бэйзед очереди. На пульсаре тоже самое будет

Насколько я читал, pulsar предоставляет семантику "обработано". А это ключевое, чего мне не хватает в кафке

00:39пожаловаться

Нет в rmq гарантий обработки. И нигде нет и не может быть )

00:39пожаловаться

Phil Delgyado

Мне важен порядок комита офсета

00:40пожаловаться

В смысле 'порядок коммита'?

00:40пожаловаться

Ну чтобы офсет был строго закомичен только после хорошей обработке

00:41пожаловаться

Порядок обработки при этом важен?

00:41пожаловаться

Я пишу про семантику "обработано". Когда я подтверждаю ack'ом обработку одного сообщения. В кафке семантика коммита офсета - прочитано. Потому как изначально она была спроектирована для использования с данными, допускающими потерю

00:44пожаловаться

Phil Delgyado

Порядок обработки при этом важен?

В случае кафки важен. Для логики - нет

00:44пожаловаться

В Кафке ты сам управляешь моментом, когда и где делать оффсет. Можешь при чтении, можешь при обработке.
Если порядок не важен - то заводи побольше партиций, читай по одной записи, настраивай масштабирование как хочешь.

00:46пожаловаться

В кафке вы либо берете из партиции строго поочередно и значит не можете взять в одновременную работу сообщений больше чем партиций, либо до пускает потерю сообщений.

00:47пожаловаться

Ты можешь одним консумером читать из кучи партиций. Собственно, число консумеров не может быть больше числа партиций, но меньше - легко.

00:47пожаловаться

А сколько тебе нужно одновременно? Если rmq справляется, то хватит и 100.

00:48пожаловаться

Ну или взять пачку, после обработки часть вернуть обратно. И это вполне надёжно

00:49пожаловаться

С учётом транзакций внутри Кафки можно и более сложные логики делать. Но обычно не надо.

00:50пожаловаться

Все реальные гарантии rmq я построю на Кафке, только с большей производительностью.

00:50пожаловаться

Я знаю как работает кафка досточно хорошо)) И именно это знание заставляет меня искать альтернативы. Если мой проект будет допускать потерю данных - возьму кафку. Таких областей много.