Господа дата инженеры, можете пожалуйста что-нибудь посоветовать по следующему кейсу?
Есть кафка, есть желание все что в ней было складывать в хдфс. Номинально в целях холодного хранения, однако все-таки данные частенько смотрят бизнес аналитики (больше никуда данные в таких объемах не пишутся), так что должна быть какая-то оперативность. Чем лучше всего организовать своевременный транспорт данных из кафки в хдфс, если кафка-коннект - не вариант? Пока что смотрели в сторону spark streaming и NiFi . Ощущение что первое - это из пушки по комарам, а второе - микроскопом гвозди