И Ivan
Представьте, что хотите поменять 4 подряд идущих инта в 4 потока, по одному инту на поток, но зачемто используя sse инструкции
Был очень забавный пример, когда простая трансформация вроде "обнулить все чётные элементы" для int64 запускалась по отрезкам на разном числе потоков и демонстрировалось, что начиная с некоторого количества реальное время не меняется (потому что выбирается канал оперативной памяти)