Size: a a a

2020 February 02

V

Vitalij in pro.kafka
всем привет,
может можете поделиться впечатлением/опытом если используете кафка класетер на нескольких датацентрах. Конкретно интересует как ведет себя кафка, если латенси между двумя/всеми ДЦ вырастает не на долго? И как боретесь с этим? Может какие-нибудь конкретные рекомендации?
источник

VG

Vik Gamov in pro.kafka
Vitalij
всем привет,
может можете поделиться впечатлением/опытом если используете кафка класетер на нескольких датацентрах. Конкретно интересует как ведет себя кафка, если латенси между двумя/всеми ДЦ вырастает не на долго? И как боретесь с этим? Может какие-нибудь конкретные рекомендации?
Для начала, Смотрим доклад Jakub Korab на kafka summit London 2019
источник

V

Vitalij in pro.kafka
Vik Gamov
Для начала, Смотрим доклад Jakub Korab на kafka summit London 2019
да конечно, его уже посмотрел. Мне интерестно, кто использует мульти ДЦ архитектуру, как она показывает себя на практике. Все работает без проблем, или приходится сталкиваться с какими-нибудь проблемами, которых небыло в одном датацентре.
источник

GG

George Gaál in pro.kafka
очевидно, что в мультидц есть проблемы, которых нет в одном дц
источник

GG

George Gaál in pro.kafka
Vik Gamov
Для начала, Смотрим доклад Jakub Korab на kafka summit London 2019
+
источник

GG

George Gaál in pro.kafka
а вообще при прочих равных - я бы не делал растянутый кластер. а делал кластер per ДЦ и настраивал между ними миррормейкер + по возможности подумал об шардировании данных
источник

V

Vitalij in pro.kafka
George Gaál
а вообще при прочих равных - я бы не делал растянутый кластер. а делал кластер per ДЦ и настраивал между ними миррормейкер + по возможности подумал об шардировании данных
а почему?
источник

GG

George Gaál in pro.kafka
потому что 2 ДЦ с растянутым кластером по очевидным соображениям - неотказоустойчиво
источник

GG

George Gaál in pro.kafka
тебе минимум нужно 3. Дальше ты думаешь про летенси между ДЦ. И что будет если оно будет скакать. Каналы связи не в твоей епархии и никто не гарантирует QoS
источник

GG

George Gaál in pro.kafka
единственный шанс - если у тебя своя оптика или это не разные ДЦ, а разные AZ одного ДЦ или одного провайдера
источник

V

Vitalij in pro.kafka
понятно, спасибо. Да, летенси сейчас и беспокоят меня. В пронципе между 3 ДЦ у нас латенси маленкие < 10мс, но бывает моментами вырастают
источник

V

Vitalij in pro.kafka
и непонятно как кафка будет себя вести в таких условиях
источник
2020 February 03

GM

Gleb Mekhrenin in pro.kafka
10 мс это не "маленькие латенси" уже, а несколько тысяч км. Если речь идёт о любого рода метро-клкстерах то 100 км между дц то еще варианты есть, но надо понимать как вы будете обрабатывать сплитбрейн и прочие состояния подобные при том что у вас будет по одной ноде зк и кафки на дц. То что сам датацентр может сколько угодно стабильным быть никак не защитит от того что может происходить с сетью, даже при условии что это один сервис провайдер и сети между дц якобы тоже его.
Опять же у меня сразу простой вопрос возникает, а у вас "обычных" бд нет? ну как бы кафку защитили, а остальное вообще не решаемо или невероятно сложно решаемо по факту за пределами одного дата центра.
источник

GG

George Gaál in pro.kafka
Gleb Mekhrenin
10 мс это не "маленькие латенси" уже, а несколько тысяч км. Если речь идёт о любого рода метро-клкстерах то 100 км между дц то еще варианты есть, но надо понимать как вы будете обрабатывать сплитбрейн и прочие состояния подобные при том что у вас будет по одной ноде зк и кафки на дц. То что сам датацентр может сколько угодно стабильным быть никак не защитит от того что может происходить с сетью, даже при условии что это один сервис провайдер и сети между дц якобы тоже его.
Опять же у меня сразу простой вопрос возникает, а у вас "обычных" бд нет? ну как бы кафку защитили, а остальное вообще не решаемо или невероятно сложно решаемо по факту за пределами одного дата центра.
Нету там сплит брейна 🤦‍♂ там больше вопрос в том, что 2 ДЦ недостаточно для обеспечения отказоустойчивости
источник

GG

George Gaál in pro.kafka
Касательно "остального" хороший вопрос
источник

E

Etki in pro.kafka
там же решение о приеме сообщение принимается не кворумом, или я опять пропустил всё?
источник

GG

George Gaál in pro.kafka
Спроси у Глеба (с)
источник

N

Nikolay in pro.kafka
10мс - это не очень большое лэтэнси. Диски жёсткие обычно по 8 мс.
источник

GG

George Gaál in pro.kafka
Не аргумент от слова совсем
источник

N

Nikolay in pro.kafka
Это аргумент скорее к тому ,что нужно проверять пропускную способность и смотреть , какая вас устраивает . Устраивать может и 10мс, а может даже и больше. На основе лэтэнси почти невозможно вычислить пропускную способность , которую вам выдаст кафэка потому ,что тот же продюсер может пакетировать запросы. Вот если вы используете синхронного продюсера ,то ещё что -то можно посчитать.
источник