Совсем недавно в BigQuery появилась возможность создавать
Clustered tables - таблицы, которые можно разбивать на кластеры по значениям полей таблиц. Это позволяет, по аналогии с
партиционированием, при обращении к данным обрабатывать только их часть в рамках выбранного кластера. Другими словами - позволяет быстрее и дешевле получить результат.
Стоимость обработки данных в BigQuery довольно низкая но, если планируете работать с большими данными постоянно, то подобная
оптимизация поможет уменьшить затраты в будущем, иначе они могут расти в геометрической прогрессии.
via
@BigQuery