Меняет только edi, но в зависимости от флага std/cld на -4 и на +4 соответственно. Кладёт значение из eax в адрес на который указывает edi. С приставкой rep может повторить ecx раз.
стос - запомнит ал,ах,еах в ди,еди,лодс - загрузит ал,ах,еах из си,еси, мовс - перемещает из си,еси в ди,еди не трогая еах, затрагиваются только те регистры которые непосредственно описаны в операции.
я статью на хабре читал, там какой то суперкомпилятор, для эльбруса разработан, который заменяет аналогичную суперархитектуру современных процов и супердлинные регистры, но они вообще по размеру что то типа sse но вроде как в них загружаешь данные и они их параллельно обрабатывают за счет чего можно крутого быстродействия достичь, типа как отдельные ядра получаются эти регистры. И был еще там небольшой пример программы на асме и сравнение с x86 такой же программы на асме