возможно, уже ответили...
я, когда нужно было выгружать большие порции из партиционированных таблиц Оракла в Ходуб, делал так:
1) на стороне Оракла
CREATE TABLE DAILY_SHIT_EXT
ORGANIZATION EXTERNAL (
TYPE ORACLE_DATAPUMP
DEFAULT DIRECTORY HADOOP_DIR
LOCATION ('daily_piece_of_shit_1.dmp', 'daily_piece_of_shit_2.dmp')
)
PARALLEL 2
AS SELECT * FROM large_shit PARTITION (sub_shit);
2) средствами секретных баш-техник в виде ssh/scp и hdfs cli перекидывал выгружаемые дампы 'daily_piece_of_shit_1.dmp', 'daily_piece_of_shit_2.dmp' в HDFS
3) создавал в Hive внешнюю таблицу с DatapumpStorageHandler и извлекал из нее в целевую паркет-таблицу
нихрена меня глюкануло... некрофилия прямо. почему-то Телеграм открыл ленту сообщений за март, зацепился глазом за вопрос Кривды по выгрузке из Оракла.
прошу простить!