А можешь там глянуть как будет быстрее?
mov ax, [bx+si]
mov ax, [bp+di]
mov ax, [bx+di]
mov ax, [bp+si]
Если не ошибаюсь, скорость выполнения должна быть быстрее у первых двух, нежели у последних.
Почему? Не думаю, что будет какая-то разница, хотя х/з, конечно, всё возможно :)
Исходник же есть выше. Там всё понятно.
Подставь варианты и проверь.
ЗЫ: Там, кстати, 64-битный код, так что не знаю, как ты будешь такое проверять...