При cpu, gpu+cpu, gpu нужно подбирать разный размер тайлов, там выше где то скидывали таблицу более менее подходящих размеров. Для проца меньше размер ведь рендерит отдельно каждое ядро свой тайл, ядра не могут обрабатывать сразу много за раз. На видюхе сразу дофигища ядер рендерят одновременно, поэтому и размер тайла больше, сразу все ядра рендерят много инфы, при маленьком размере не всем ядрам достанется работа, поэтому медленнее
был бы признателен тому, кто скинет еще раз эту табличку