Дешевле хранить раз в 5-7, плюс Spark. До кубера мы его использовали, даже если данные были не на hdfs
В Ашане 3 кассовые системы, 3 разных потока чеков по структуре. Нужно было все причесать и положить в едином формате. Hadoop, имхо - самое то исходя из баланса стоимость-производительность, удобство