Вот на счёт индекс-буфера более-менее ясно. Вместо сотен тысяч индексов - номер кусочка (в котором сотня-другая своих индексов) ещё и в on-chip памяти, если топология не меняется. А вот на счёт параллелизма - не совсем ясно. VS же все равно придется применять матрицы преобразования к каждому вертексу. И растеризовать придется каждый примитив. В чем тут выигрыш мне не совсем ясно.
Спасибо за ответ.
Я не совсем понял про VS, т.к. он в этом пайпе отсутсвует, но там суть что загрузка данных идет не через обычный примитив фетч, а через шейдерные инструкции на стриминговых мультипроцессорах. Т.е. это все к вопросу скалирования (и возможности иной упаковки данных)