порезал мету покускам; зашафлил; прочитал что надо
А вот тут может оказаться и флинк получше ;)
На вход линк на файл, в кафке лишь евент, первый map вытягивает и парсит файлик порождая поток евентов, следующие их процессят
В случае спарка зачастую у тебя происходит материализация этих всех евентов (нужно же закончить сразу парсить, прежде чем перейти на следующий шаг)
Во флинке это поток эвентов и пока файл парится на выходе они уже складываются в выходную очередь после обработки