Это C++ библиотека. Такая большая разница между вектороной и скалярной версиями объясняется тем, что оригинальный код изначально использовал SIMD интринсики, которые эмулировались в скалярной версии. Тут показательно то, что wasm с SIMD и native с SIMD не сильно так и отличаются. Ну и прекрастно виден потенциал WebAssembly. Собственно JS никогда не будет автовекторизироваться или даже просто векторизироваться. Поэтому с приходом SIMD тезис о том, что wasm не всегда быстрее JS отпадет сам собой, по крайней мере для приложений где возможна векторизация