Size: a a a

2019 November 19

AZ

Anton Zadorozhniy in Data Engineers
Eduard Vlasov
А поясните плиз нубу про проблему скейлинга в кафка стримс и чем flink/spark приятнее в этом вопросе
kstreams это библиотека, там нет сервера приложений / кластера как такогового, авторам нужно самим решать сколько воркеров и где запустить, решать проблему их переподьема и расширения
источник

AZ

Anton Zadorozhniy in Data Engineers
flink и spark это фреймворки которые умеют свой кластерный фреймворк, или садятся на другие (YARN, k8s)
источник

V

VladMl in Data Engineers
Eduard Vlasov
А поясните плиз нубу про проблему скейлинга в кафка стримс и чем flink/spark приятнее в этом вопросе
Как по мне то самые основные проблемы описаны тут https://www.jesse-anderson.com/2019/10/why-i-recommend-my-clients-not-use-ksql-and-kafka-streams/
источник

EV

Eduard Vlasov in Data Engineers
Anton Zadorozhniy
flink и spark это фреймворки которые умеют свой кластерный фреймворк, или садятся на другие (YARN, k8s)
понял принял обработал
источник

EV

Eduard Vlasov in Data Engineers
VladMl
Как по мне то самые основные проблемы описаны тут https://www.jesse-anderson.com/2019/10/why-i-recommend-my-clients-not-use-ksql-and-kafka-streams/
спасибо
источник

IP

Ilya Pribytkov in Data Engineers
Daniel Matveev
так может посмотреть тип у результата col?
источник

IP

Ilya Pribytkov in Data Engineers
в общем суть в том что такой колонки в результирующем  датафрейме нет, но есть колонка с суммой, только я не знаю как к ней обратиться
источник

A

Alex in Data Engineers
Anton Zadorozhniy
kstreams это библиотека, там нет сервера приложений / кластера как такогового, авторам нужно самим решать сколько воркеров и где запустить, решать проблему их переподьема и расширения
либо купить confluent platform 😉
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
либо купить confluent platform 😉
как это решает проблему?)
источник

A

Alex in Data Engineers
у них же вроде управление воркерами и мониторингом для kstream имеется
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
у них же вроде управление воркерами и мониторингом для kstream имеется
а кинь ссылку, я чот как-то пропустил..
источник

A

Alex in Data Engineers
источник

V

VladMl in Data Engineers
Anton Zadorozhniy
flink и spark это фреймворки которые умеют свой кластерный фреймворк, или садятся на другие (YARN, k8s)
фактически нужно решить сколько инстансов аппликейшена запускать, обычно равно количеству партишенов, а дальше аппликейшен точно также может жить и в yarn и в k8s.
источник

A

Alex in Data Engineers
лучше спросить тут, там @gamussa как представитель конфлюента расскажет
источник

AZ

Anton Zadorozhniy in Data Engineers
VladMl
фактически нужно решить сколько инстансов аппликейшена запускать, обычно равно количеству партишенов, а дальше аппликейшен точно также может жить и в yarn и в k8s.
а можете ссылку на интеграцию с yarn/k8s прислать?
источник

V

VladMl in Data Engineers
Anton Zadorozhniy
а можете ссылку на интеграцию с yarn/k8s прислать?
источник

AZ

Anton Zadorozhniy in Data Engineers
это запуск самой кафки, я про пользовательские приложения с kstreams
источник

DM

Daniel Matveev in Data Engineers
Anton Zadorozhniy
kstreams это библиотека, там нет сервера приложений / кластера как такогового, авторам нужно самим решать сколько воркеров и где запустить, решать проблему их переподьема и расширения
Есть. Но он оч примитивный.
источник

V

VladMl in Data Engineers
а в чем собственно заключается интеграция? это обчыное java приложение, которое можно запустить хоть в кубике хоть в ярне
источник

DM

Daniel Matveev in Data Engineers
Alex
либо купить confluent platform 😉
Есть и в бесплатном
источник