С таблицей куда быстрее будет. Синусы очень долгие. Вообще, SSE (даже скалярные операции) немного быстрее, чем FPU, даже расчет синуса через ряды Тейлора (главное, правильно сделать, чтобы минимизировать зависимости результатов). А если считать через короткий ряд, то ещё быстрее (точность будет ниже, но для графики достаточная).
Когда-то делал без FPU, в EXCELe рассчитывал таблицу от 0° до 90° для cos, только опорная таблица занимала 2×90=180 байт: значения от 0 до 10000, т.е. как от 0 до 1.0 только целочисленные. Шаг дискретизации так себе конечно, но вроде хватало.
Обхожусь только cos. Для sin просто сдвигаю cos на 90°.
А в этой демке нет ни одной таблицы, если их предварительно сделать, конечно будет быстрее за счёт занимаемой памяти, да и если делать, то уже не опорную, а на все условия которые могут возникнуть в алгоритмах, чтобы было ещё быстрее.