А принципиально то, что есть сценарии, когда данные удобно хранить в больших файлах, которые можно быстро вычитывать частями параллельно для массовых трансформаций/вычислений
Если вы строите озеро данных большой корпорации или гос. учреждения и вам нужно иметь хранилище первичных данных, часто с поддержкой историчности, там где это возможно, то альтернатив у Hadoop нет
В последние годы стало больше альтернатив. Например логи можно в кликхаус сложить, файлы в условный ceph. Остальное неплохо ляжет в аналитические хранилища