ой опять выпендриваешься )
ну не совсем, надо понимать, что векторизация она во первых не всегджа быстрее регистрового кода, но скажем, последний - имеет массу крутых кейсов, когда можно сделать реально быстро. И да, у меня есть кое-какой код, который на x64 у AMD работает быстрее Гугла, на 20%, а на ARM в 2 раза. Ну это так, я когда-то хотел статью на хабр выложить, но в итоге потерял мотивацию и ушел в работу.