Size: a a a

2020 September 23

VG

Vik Gamov in pro.kafka
IV
да, хотелось бы понять механизм, т.е. если делается репартишн, то добавляются избыточные топики, означает ли это, что будет пропорциональный рост объёма данных на диске?
Наоборот - оптимизацию топологии делают чтобы меньше топиков создавать промежуточных
источник

I

IV in pro.kafka
Vik Gamov
Наоборот - оптимизацию топологии делают чтобы меньше топиков создавать промежуточных
вот где бы найти описание механизма репартиций
источник

I

IV in pro.kafka
промежуточные топики при операциях KStream.map, KStream.transform, KStream.flatMap будут всегда создаваться? т.е. в таких задачах полюбому будут новые топики, соответственно и забьёт дополнительно место на диске? хотелось бы понимать такие моменты, чтобы не выйти за рамки ресурсов
источник

VG

Vik Gamov in pro.kafka
IV
вот где бы найти описание механизма репартиций
Давай с начала - repartition это процесс через который проводят стрим чтобы привести его к виду который, например, приготовит его для join. Ну т.е. исходный топик и топик для join могут иметь разное кол-во partitions и сходу join не сделать.
источник

VG

Vik Gamov in pro.kafka
IV
промежуточные топики при операциях KStream.map, KStream.transform, KStream.flatMap будут всегда создаваться? т.е. в таких задачах полюбому будут новые топики, соответственно и забьёт дополнительно место на диске? хотелось бы понимать такие моменты, чтобы не выйти за рамки ресурсов
Там есть методы с ключем или с value. Если методы с ключем repartition крайне возможен. KIP про оптимизации сходу не нашел - уточню в команде
источник

I

IV in pro.kafka
Vik Gamov
Там есть методы с ключем или с value. Если методы с ключем repartition крайне возможен. KIP про оптимизации сходу не нашел - уточню в команде
спасибо за ответ!
источник

I

IV in pro.kafka
понимать, окажет ли такие операции влияние на ресурсы дисковой подсистемы в плане места
источник

VG

Vik Gamov in pro.kafka
А не premature оптимизацие вы батенька занимаетесь?
источник

Y

Yuriy in pro.kafka
Vik Gamov
А не premature оптимизацие вы батенька занимаетесь?
плохое решение изначально, если так)
источник

I

IV in pro.kafka
пока просто хочу понять мат часть 😎
источник

DS

Dmytro Striletskyi in pro.kafka
Привет.

У меня 20 воркеров, которые делают одну и ту же работу в одних и тех же условиях, но почему-то у одних воркеров LAG большой, а у других маленький. Есть какие-то очевидные причины почему так может быть?
источник

O

Oleg in pro.kafka
Dmytro Striletskyi
Привет.

У меня 20 воркеров, которые делают одну и ту же работу в одних и тех же условиях, но почему-то у одних воркеров LAG большой, а у других маленький. Есть какие-то очевидные причины почему так может быть?
а колво сообщений в партициях одинаковое примерно?
источник

S

Slava in pro.kafka
Dmytro Striletskyi
Привет.

У меня 20 воркеров, которые делают одну и ту же работу в одних и тех же условиях, но почему-то у одних воркеров LAG большой, а у других маленький. Есть какие-то очевидные причины почему так может быть?
data locality?
источник

DS

Dmytro Striletskyi in pro.kafka
Oleg
а колво сообщений в партициях одинаковое примерно?
Да. Даже те воркеры, у которых LAG меньше, заасайнены в партишены, у которых сообщений больше.
источник

VG

Vik Gamov in pro.kafka
Дратути, откуда вестимо?
источник

VS

Vladyslav Sakun in pro.kafka
Vik Gamov
Дратути, откуда вестимо?
Ссылочку на чатик в канале о Кликхаузе оставили 🙂
источник

VG

Vik Gamov in pro.kafka
Vladyslav Sakun
Ссылочку на чатик в канале о Кликхаузе оставили 🙂
Респект таким пацанам ©️
источник

VG

Vik Gamov in pro.kafka
источник

O

Oleg in pro.kafka
Dmytro Striletskyi
Да. Даже те воркеры, у которых LAG меньше, заасайнены в партишены, у которых сообщений больше.
а насколько больше лаг?
источник

DS

Dmytro Striletskyi in pro.kafka
Oleg
а насколько больше лаг?
В 5-20 раз разница (по-разному), в основном это где-то 30% самый большой, 30% средний, и 30% совсем маленький. Например, 7 воркеров по 10К, 7 по 3К, 7 по 180.
источник