В Вертике эта тема подробно разобрана, половина оптимизации основана на упорядоченности нужных колонок. При сжатии работает то же самое, так как хорошо сжимаются повторяющиеся значения.
Для этого вверх ордер бай суют колонки с минимальным количеством уникальных значений и далее по нарастающей.
Если нужно сортироваить даты или веса, первые можно разбить по годам, месяцам (дням), вторые разбить на диапазоны .
Поиск или джоин по таким полям идет намного кайфовее.
При сжатии, если это критично, в смысле много обращений на чтение и мало на запись, упорядоченные данные должны сжаться намного лучше.