гриша говорит про партишонинг, когда спарк, не важно рдд или скл разбивает жирное вычисление на кучу вычислительных джоб, каждую рассылает по воркерам, отслеживает их состояние, и координирует пересылку между воркерами для последующих стадий
а тут говорится про спец механизм именно в скл, который вообще сам по себе колоночно-ориентированный, и фильтры пушдаунятся насколько возможно до хранилища, и в зависимости от типа источника превращаются в фильтры чтения из СУБД или даже ограничения на сами читаемые файлики, чтобы не вычитывать весь датасет целиком, если фильтры его сильно ограничивают