Телеграмм чат группы proKafka страница 1650

2021 January 08

AN

Artem Nenashev in pro.kafka

Sergey, вот есть доклад с highload, видимо как раз тот вариант, который вам нужен https://www.youtube.com/watch?v=mQiS-_fzTbc&ab_channel=HighLoadChannel

YouTube

Паттерны проектирования приложений на Apache Kafka / Александр Сибиряков (Scrapinghub)

При поддержке AvitoTech мы впервые публикуем все видео с HighLoad++ 2019 в открытый доступ. Учитесь, вдохновляйтесь и перенимайте лучшие практики у спикеров, не выходя из дома.
--------
Календарь конференций - https://ontico.ru
--------
Highload++ 2019

Тезисы и презентация:
https://www.highload.ru/moscow/2019/abstracts/6072

Я расскажу о том, как проектировать надёжные пайплайны, состоящие из большого числа компонент на основе Apache Kafka. В докладе будут разобраны основные принципы проектирования, а также будут разобраны архитектурные паттерны очередей, обратной связи (back pressure), стыковка с HTTP, потери сообщений, и обработка задач с большим разбросом по времени выполнения.
...
--------
Нашли ошибку в видео? Пишите нам на support@ontico.ru

источник

15:10пожаловаться #1

SS

Sergey Sokolov in pro.kafka

Artem Nenashev

в общем я в этой схеме вижу только одну проблему - целесообразность и оверинжинирг. я бы точно так не стал так делать, для этого нужны какие-то веские по более "ну может потом это всё будет асинхронно".
и, кстати, каким боком здесь Kafka Stream появился?

Да, реализация сложная.
Kafka Steam появился потому что на стриме есть метод filter , который как раз позволит найти нужное сообщение

источник

15:11пожаловаться #2

SS

Sergey Sokolov in pro.kafka

Artem Nenashev

Sergey, вот есть доклад с highload, видимо как раз тот вариант, который вам нужен https://www.youtube.com/watch?v=mQiS-_fzTbc&ab_channel=HighLoadChannel

YouTube

Паттерны проектирования приложений на Apache Kafka / Александр Сибиряков (Scrapinghub)

При поддержке AvitoTech мы впервые публикуем все видео с HighLoad++ 2019 в открытый доступ. Учитесь, вдохновляйтесь и перенимайте лучшие практики у спикеров, не выходя из дома.
--------
Календарь конференций - https://ontico.ru
--------
Highload++ 2019

Тезисы и презентация:
https://www.highload.ru/moscow/2019/abstracts/6072

Я расскажу о том, как проектировать надёжные пайплайны, состоящие из большого числа компонент на основе Apache Kafka. В докладе будут разобраны основные принципы проектирования, а также будут разобраны архитектурные паттерны очередей, обратной связи (back pressure), стыковка с HTTP, потери сообщений, и обработка задач с большим разбросом по времени выполнения.
...
--------
Нашли ошибку в видео? Пишите нам на support@ontico.ru

Спасибо, гляну

источник

15:11пожаловаться #3

AN

Artem Nenashev in pro.kafka

Sergey Sokolov

Да, реализация сложная.
Kafka Steam появился потому что на стриме есть метод filter , который как раз позволит найти нужное сообщение

фильтр по correlationId? у мне нет какого-то релевантного опыта по Kafka Stream, но подозреваю, что так не делают :). скорее у сервиса, который держит http-соединения должна быть в памяти таблица соответствия соединения своему correlationId и фильтрация будет уже по этой таблице

источник

15:16пожаловаться #4

SS

Sergey Sokolov in pro.kafka

Artem Nenashev

фильтр по correlationId? у мне нет какого-то релевантного опыта по Kafka Stream, но подозреваю, что так не делают :). скорее у сервиса, который держит http-соединения должна быть в памяти таблица соответствия соединения своему correlationId и фильтрация будет уже по этой таблице

Фильтрация топика для поиска нужного сообщения, это один из подходов. У него есть недостатки, так как приходится фильтровать большое количество сообщений.

Но у меня вопрос создание короткоживущих консьюмеров или стримов, на каждый запрос. Насколько это затратно с точки зрения ресурсов Кафки.

источник

15:41пожаловаться #5

AN

Artem Nenashev in pro.kafka

по поводу ресурсных затрат я точно знать не могу, но выглядит не очень оптимально. может кто-то с большим опытом прокомментирует.
а вот по поводу Stream'а у меня вопрос: я же правильно понимаю, что этот стрим кладет что-то в KTable по ключу correlationId?

источник

15:45пожаловаться #6

PD

Phil Delgyado in pro.kafka

Sergey Sokolov

Добрый день, подскажите пожалуйста бест практис,
Задача в том чтобы реализовать взаимоедействие вебклиента с микросервисным бакендом, где микросервисы общаются между собой с помощью Kafka.

вопрос в первую очередь, как реализовать синхронное взаимодействие в виде request/reply ?

Думали сделать такой вариант: веб клиент генерит corellationId и выполняет запрос к бэку например createBook,
далее логика такая
1. бакнед подписывается на топик кафка book-created спомощью KafkaStreams делает filter по key=correlationId
2. бакнед отпарвляет команду CreateBookCmd в топик кафка book-create и среди прочего передает correlationId
3. далее какой-то консьюмер обрабатывает команду из топика book-create, создает Book и генерит BookCreatedEvent в топик book-created
4. бакенд получате событие из топика book-created с нужным corellationId и затем отдает ответ на вебклиента.

в таком сценарии получается что на каждый запрос вебклиента создается новый короткоживущий экземпляр KafkaStreams и вызывается start , stop
вопрос насколько ресурсоемко создание экземпляров KafkaStreams на каждый запрос от вебклиента?
как я понимаю такое решение аналогично созданию консьюмера для топика book-created с последующим чтением всех событий и отбрасыванию с несоотвсвующими corellationId.
Соответсвенно вопрос насколько ресурсоемко создание коньюмера на каждый запрос от вебклиента?

Может быть есть более правильные паттрены (что бы уйти от request/reply на фронте)?

Клиент же реактивный, подозреваю? И тогда никакой синхронный http ему и не нужен, проще request получить через http (и там, конечно, просто rest level 1), а ответ получить через подписку на websockets, склейку и сам клиент может сделать.
Это будет гораздо масштабируемее и проще в реализации в конечном итоге.
Единственное - нужно будет как-то обеспечивать надежные очереди для websockets, но для этого есть вполне себе набор внешних решений

источник

16:21пожаловаться #7

YZ

Yuri Zavyalov in pro.kafka

Сделали подобное решение (request/reply через kafka) - работает очень надёжно, однако пришлось реализовать свою библиотеку, которая закрывает от разработчика все хитрости обмена (подписка на партиции нужных response-топиков, поиск и закрепление нужных партиций, разбивка и склейка фреймов данных)

источник

16:49пожаловаться #8

YZ

Yuri Zavyalov in pro.kafka

Плюсы решения: сервисы не знают ничего друг о друге, балансировка исполнения запросов из коробки (горизонтальное масштабирование многоэкземплярных сервисов настраивается легко), нет необходимости контролировать успешность обработки (например, в случае сетевых сбоев) запроса со стороны запрашивающего сервиса и прочее

источник

16:52пожаловаться #9

YZ

Yuri Zavyalov in pro.kafka

Минусы: сложности с портированием сервисов не в Java (придется писать свою либу под нужный ЯП и/или среду исполнения), существенно усложняется процесс поддержки топиков в части партиций (связано исключительно с нашей реализацией механизма)

источник

16:58пожаловаться #10

N

Nick in pro.kafka

Phil Delgyado

Клиент же реактивный, подозреваю? И тогда никакой синхронный http ему и не нужен, проще request получить через http (и там, конечно, просто rest level 1), а ответ получить через подписку на websockets, склейку и сам клиент может сделать.
Это будет гораздо масштабируемее и проще в реализации в конечном итоге.
Единственное - нужно будет как-то обеспечивать надежные очереди для websockets, но для этого есть вполне себе набор внешних решений

а в чем проблема в очередях для вебсокетов, если из кафки читаем и сразу пушаем в сокет?

источник

17:30пожаловаться #11

EB

Eugene Bosiakov in pro.kafka

Yuri Zavyalov

Сделали подобное решение (request/reply через kafka) - работает очень надёжно, однако пришлось реализовать свою библиотеку, которая закрывает от разработчика все хитрости обмена (подписка на партиции нужных response-топиков, поиск и закрепление нужных партиций, разбивка и склейка фреймов данных)

Решалась какая-то задача или оверинжиниринг ради оверинжиниринга?

источник

17:45пожаловаться #12

YZ

Yuri Zavyalov in pro.kafka

Eugene Bosiakov

Решалась какая-то задача или оверинжиниринг ради оверинжиниринга?

Решалась задача надёжности и прогнозируемости доставки каждого сообщения до сервисов и между сервисами

источник

17:46пожаловаться #13

EB

Eugene Bosiakov in pro.kafka