Почему не будет пользы?
Всегда есть смысл оптимизировать какой-то участок на ассемблере, даже по самой банальной причине - Си компилятор не может понять, как ему оперировать с регистрами - он не знает, какой нужен пользователю, поэтому зачастую жанглирует ими. Ну и ещё много других причин - почему Си компилятор не может оперировать m, r - r, m, а делает mov, а потом r, r - когда выгоднее m, r-r,m.