Я снова не могу понять людей, которые пишут, что Си всегда быстрее ассемблера
Код на ассемблере легче оптимизировать, если у тебя есть мозги, чем код на Си, и он будет быстрее работать.
А ещё на ассемблере ты сам выбираешь, что тебе важнее - вес, или скорость. Си это делает мутно, и в итоге всё равно выдаст тебе не меньше 9 кб