Друзья добрый день! Кто нибудь мог бы подсказать по кейсу? Есть топик кафки, где данные лежат в формате Apache Thrift binary, нужно их конвертить и складывать в ClickHouse, так же одно из условий, запускать по YARN'ом. Прототип написан через kafka-spark-streaming + spark-jdbc + clickhouse-jdbc. Но решение через спарк выглядит как "из пушки по воробьям". Заранее спасибо!
Друзья добрый день! Кто нибудь мог бы подсказать по кейсу? Есть топик кафки, где данные лежат в формате Apache Thrift binary, нужно их конвертить и складывать в ClickHouse, так же одно из условий, запускать по YARN'ом. Прототип написан через kafka-spark-streaming + spark-jdbc + clickhouse-jdbc. Но решение через спарк выглядит как "из пушки по воробьям". Заранее спасибо!
почему из пушки? 6 строчек кода на спарк сс всего то, поддерживать легко
ну и если работать с тем же кликхаусом по наполнению надо будет не единожды, может иметь смысл рассмотреть конфигурируемые переливаторы аля флюм, кафка-коннект и прочие