из младшего дворда старший бит у тебя уйдет в cf, при первой итерации. При второй бит из cf уйдет в младший бит второго дворда, а старший бит второго дворда попадет в cf, и так далее. Не надо ничего сохранять.
т.е тут получается в конце 32 итерации весь участок dwordow подвинется на dword вправо а в процессе итераций там будут undefined behavior данные а если надо например на пару байт только данные подвинуть
я имел ввиду кол-во операций проведенных над каждым из цепочки регистров любого колличества т.е. у тебя старший бит будет залетать в младший соседнего регистра я так понял, так что сдвиг на один бит не будет иметь смысла потому что данные будут испорчены
я немного запутался, значит не правильно понимаю алгоритм действия этих комманд, они взаимодействуют с соседними областями памяти или соседними регистрами, ну с памятью понятно а как допустим они знают какой регистр соседний в цпу?