Причем здесь трифт? Трифт-сервер это рядом стоящий и довольно валкий демон, который способен запустить спарк джобу без явного сабмита, по jdbc. Но все данные-то он в памяти не держит и пойдет их читать откуда-то из hdfs/s3/csv чтобы вернуть результат. Что вообще значит фраза «данные лежали в спарке»?
да не будет никакой дискуссии. У меня это работало и работало хорошо. До тех пор, пока, как справедливо написали, глючний фрифи с очередным релизом перестал работать как надо
посмотрел в своем метасторе, есть таблица, которая хранит названия колонок для бакетирования, самих значений как с партициями там нет. Вероятно хэш бакета определятся на лету при обращении по колонке с бакетом