Здравствуйте. Недавно переехали с хадупа хортонворкс на клаудеру, и из-за этого у нас изменилась версия хайв и спарка.
В хайве мы юзаем орк-файлы, и после переезда на клаудеру начались проблемы чтения с ними. При попытке выбрать все данные таблицы, записанной в орк, выдает nullpointerexception. Сказали, что это из-за старых версий орк-файлов и в таких случаях посоветовали установить опции convertMetastoreOrc: false и EnableVectorizedReader: true.
Но после этого датасет начал возвращать меньше данных, чем на самом деле есть в таблице.