Телеграмм чат группы proKafka страница 1318

2020 May 05

OK

привет, а есть те, кто завозил ZK с SASL на жаве? что-то я смотрю в доку и плакать хочется, в принципе вопрос так же актуален и к Кафке

источник

12:15пожаловаться #1

OK

Oleg Kovalov in pro.kafka

хочется просто подружить клиент кафки с org.apache.kafka.common.security.plain.PlainLoginModule

источник

12:15пожаловаться #2

AH

Ayrat Hudaygulov in pro.kafka

товарищи, простой вопрос (наверное).
Если продьюсер выставляет отличный от брокера тип компрессии, то (я предполагаю) на мнение продьюсера наплевать.
Не могу найти подтверждение в доке

источник

13:18пожаловаться #3

VG

Vik Gamov in pro.kafka

Oleg Kovalov

хочется просто подружить клиент кафки с org.apache.kafka.common.security.plain.PlainLoginModule

а брокер уже настроен или нужна настройка брокера?

источник

13:48пожаловаться #4

OK

Oleg Kovalov in pro.kafka

Vik Gamov

а брокер уже настроен или нужна настройка брокера?

не, брокер уже ходит на admin/password и все ок, вопрос только в клиенте жавы

источник

13:49пожаловаться #5

VG

Vik Gamov in pro.kafka

Oleg Kovalov

не, брокер уже ходит на admin/password и все ок, вопрос только в клиенте жавы

Sasl SSL Или sasl plain?

источник

13:49пожаловаться #6

OK

Oleg Kovalov in pro.kafka

Vik Gamov

Sasl SSL Или sasl plain?

sasl plain

источник

13:49пожаловаться #7

AU

Andrey Ustinov in pro.kafka

pain...

источник

14:09пожаловаться #8

РХ

Ринат Харисов... in pro.kafka

Всем привет! Поделитесь опытом, пожалуйста. У нас на проекте используется Кафка, клиент на Java.
Есть задача отправлять эвенты клиентам по Server Sent Event. После подключения клиент должен получить все эвенты пока он был оффлайн, а затем продолжать получать сообщения, созданные после подключения.
Хочу реализовать следующим образом. Продюсеры, которые хотят уведомить клиента, отправляют сообщения в специальный топик. Когда клиент подключается, создаем нового Кафка консьюмера на основе id пользователя(каждый пользователь это отдельная консьюмер-группа), подписываемся на все партишены в топике. Затем запрашиваем батч сообщений из Кафки, отфильтровываем сообщения для клиента, отправляем их по SSE, затем фиксируем оффсет в Кафка и так до бесконечнеости. Если клиент отключается, то просто отписываемся от всех партишенов. Простой тест показал, что при 2 партишенах прочитать 1500 сообщений пользователя из 3 млн сообщений в топике одним консьюмером занимает примерно 1,5 - 2 мин, что не проходит по требованиям. Поэтому хочу увеличить количество портишенов(например, до 1024) У нас продюсеры роутят сообщения по ключу. Консьюмер будет делать предположение в каком партишене искать сообщения на основе ключа и подписываться только на этот партишен.

Есть такие вопросы:
1. Насколько плохо иметь большое количество консьюмеров с точки зрения Кафки. Допустим, их будет параллельно более 1000 на этот топик?
2. Вывезет ли Кафка такое количество партишенов и консьюмеров?
3. Есть в описанной схеме что-то что я не учел или можно сделать лучше?
4. В схеме с фиксированным количеством партишенов есть проблема, что нельзя будет их увеличить потом так, чтобы не потерять сообщения пользователя. Как бы это можно было бы решить?

источник

16:37пожаловаться #9

VG

Vik Gamov in pro.kafka

Ринат Харисов

Всем привет! Поделитесь опытом, пожалуйста. У нас на проекте используется Кафка, клиент на Java.
Есть задача отправлять эвенты клиентам по Server Sent Event. После подключения клиент должен получить все эвенты пока он был оффлайн, а затем продолжать получать сообщения, созданные после подключения.
Хочу реализовать следующим образом. Продюсеры, которые хотят уведомить клиента, отправляют сообщения в специальный топик. Когда клиент подключается, создаем нового Кафка консьюмера на основе id пользователя(каждый пользователь это отдельная консьюмер-группа), подписываемся на все партишены в топике. Затем запрашиваем батч сообщений из Кафки, отфильтровываем сообщения для клиента, отправляем их по SSE, затем фиксируем оффсет в Кафка и так до бесконечнеости. Если клиент отключается, то просто отписываемся от всех партишенов. Простой тест показал, что при 2 партишенах прочитать 1500 сообщений пользователя из 3 млн сообщений в топике одним консьюмером занимает примерно 1,5 - 2 мин, что не проходит по требованиям. Поэтому хочу увеличить количество портишенов(например, до 1024) У нас продюсеры роутят сообщения по ключу. Консьюмер будет делать предположение в каком партишене искать сообщения на основе ключа и подписываться только на этот партишен.

Есть такие вопросы:
1. Насколько плохо иметь большое количество консьюмеров с точки зрения Кафки. Допустим, их будет параллельно более 1000 на этот топик?
2. Вывезет ли Кафка такое количество партишенов и консьюмеров?
3. Есть в описанной схеме что-то что я не учел или можно сделать лучше?
4. В схеме с фиксированным количеством партишенов есть проблема, что нельзя будет их увеличить потом так, чтобы не потерять сообщения пользователя. Как бы это можно было бы решить?

у меня вопрос - а Кафка вам тут зачем?

источник

17:04пожаловаться #10

РХ

Ринат Харисов... in pro.kafka

Vik Gamov

у меня вопрос - а Кафка вам тут зачем?

Кафка здесь как персистентное хранилище для всех сообщений пользователя с возможностью подписки

источник

17:10пожаловаться #11

DP

Denis Pavlyuchenko in pro.kafka

Ринат Харисов

Всем привет! Поделитесь опытом, пожалуйста. У нас на проекте используется Кафка, клиент на Java.
Есть задача отправлять эвенты клиентам по Server Sent Event. После подключения клиент должен получить все эвенты пока он был оффлайн, а затем продолжать получать сообщения, созданные после подключения.
Хочу реализовать следующим образом. Продюсеры, которые хотят уведомить клиента, отправляют сообщения в специальный топик. Когда клиент подключается, создаем нового Кафка консьюмера на основе id пользователя(каждый пользователь это отдельная консьюмер-группа), подписываемся на все партишены в топике. Затем запрашиваем батч сообщений из Кафки, отфильтровываем сообщения для клиента, отправляем их по SSE, затем фиксируем оффсет в Кафка и так до бесконечнеости. Если клиент отключается, то просто отписываемся от всех партишенов. Простой тест показал, что при 2 партишенах прочитать 1500 сообщений пользователя из 3 млн сообщений в топике одним консьюмером занимает примерно 1,5 - 2 мин, что не проходит по требованиям. Поэтому хочу увеличить количество портишенов(например, до 1024) У нас продюсеры роутят сообщения по ключу. Консьюмер будет делать предположение в каком партишене искать сообщения на основе ключа и подписываться только на этот партишен.

Есть такие вопросы:
1. Насколько плохо иметь большое количество консьюмеров с точки зрения Кафки. Допустим, их будет параллельно более 1000 на этот топик?
2. Вывезет ли Кафка такое количество партишенов и консьюмеров?
3. Есть в описанной схеме что-то что я не учел или можно сделать лучше?
4. В схеме с фиксированным количеством партишенов есть проблема, что нельзя будет их увеличить потом так, чтобы не потерять сообщения пользователя. Как бы это можно было бы решить?

а что делать, если пользователь пришел через месяц, и его консьюмер группа уже отсутсвует?

источник

17:20пожаловаться #12

E

Etki in pro.kafka

Именно поэтому я за «не хранить данные в брокере сообщений»

источник

17:22пожаловаться #13

E

Etki in pro.kafka

Брокер в этом случае хорош для того, чтобы слать ивенты, когда пользователь подключен

источник

17:22пожаловаться #14

РХ

Ринат Харисов... in pro.kafka

Denis Pavlyuchenko

а что делать, если пользователь пришел через месяц, и его консьюмер группа уже отсутсвует?

Если для пользователя не удалось получить оффсет, то значит пользователь подключается в первый раз или, как Вы заметили, его группа удалена. В таком случае отправляем клиенту специальное сообщений, после которого он запрашивает по ресту все что ему нужно, а консьюмер подписывается с latest.
Я, кстати, что-то не нашел инфу как долго хранится метадата группы, только то, что она в отдельном топике. Буду рад, если дадите наводку

источник

17:35пожаловаться #15

РХ

Ринат Харисов... in pro.kafka

Etki

Именно поэтому я за «не хранить данные в брокере сообщений»

Можете поделиться в чем недостатки такого подхода?

источник

17:35пожаловаться #16

x

x in pro.kafka

Ринат Харисов

Если для пользователя не удалось получить оффсет, то значит пользователь подключается в первый раз или, как Вы заметили, его группа удалена. В таком случае отправляем клиенту специальное сообщений, после которого он запрашивает по ресту все что ему нужно, а консьюмер подписывается с latest.
Я, кстати, что-то не нашел инфу как долго хранится метадата группы, только то, что она в отдельном топике. Буду рад, если дадите наводку

offsets.retention.minutes

источник

17:37пожаловаться #17

РХ

Ринат Харисов... in pro.kafka

x

offsets.retention.minutes

спасибо

источник

17:42пожаловаться #18

E

Etki in pro.kafka

Ринат Харисов

Можете поделиться в чем недостатки такого подхода?

Подозреваю, что так или иначе на каждого пользователя придется заводить топик, за этим делом надо будет как-то следить (например, оценивать объем), сложно адресовать отдельную запись (да, я уверен, что такая необходимость рано или поздно вылезет), и это всё просто чтобы выполнять задачи, которые всегда выполнялись обычным хранилищем.
Ну и кафка конечно не обычный message queue, но ожидать что в какой-то момент данные грохнет инженер, потому что он думает, что очереди забились и там уже стылые сообщени, вполне можно.

источник

17:49пожаловаться #19

NK

ID:0 in pro.kafka

Всем стрим завтра https://twitter.com/gamussa/status/1257699244150067201?s=21 - позвоните в колокольчик чтобы не пропустить.
Ну а если пропустите - все равно запись будет. Он стрим прикольнее будет, конечно

Twitter

Viktor Gamov @ 🏡🗽

📣 #LiveStreams tomorrow! I will focus on TopologyTestDriver as buy-in to testing your Kafka Streams applications. I'll try to show when unit testing helps to catch some errors very early in development. Tune in Wednesday 5/6 3:15 PM EDT ▶️ https://t.co/GPplq94mhh

источник

19:10пожаловаться #20