Я чет запутался ))
Знач в теперешней беспл. клаудере 6.3 хадуп2 и MR2.
В третьем хадупе тез?
Третий хадуп у кого?)..
В общем, мне хранить архивы и скачивать их с оракла через стримсетс , встроенный в клаудеру 6, в паркет, очень даже норм. Все устраивает, думаю, когда памяти будет поболе, то я тяжелые запросы норм будут выполняться...
А в будущем, если что, заберу паркеты в другое место...
Или есть в моих рассуждениях явные провалы, что скажете?
6.x ветка вышла ещё до поглощения, там остался хайв старый, клоудера никогда норм вещи на него не предлагала, хотите процессить используйте импалу, хайв только как метасторейдж у них. клоудера так же была спонсором разработки спарк енжайна для хайва, так как люди не все хотели уходить на импалу, но и mr это уж очень легаси
хортон продолжал пилить имеено хайв, вливал оптимизации, запилил tez, llap и тд. транзакции в хайве (в импале их не было)
на момент покупки был выбор между hive+tez+llap(для быстрых запросов)+transaction vs impala
ну ещё у хортона обычно более свежии версии компонентов были
клоудера упирала на стабильность (пускай и говно мамонта, но стабильное говно)
то есть выбор дистрибутива сразу диктовал стек который будет доступен и фичи которые доступны в компонентах