Size: a a a

Ассемблер

2021 August 29

d

disba1ancer in Ассемблер
а что таблицы говорят? и вообще она какая-то странная
источник

d

disba1ancer in Ассемблер
насчёт доступности sse хз, его, возможно, нужно как-то инициализировать
источник

E

Entusiast in Ассемблер
А тебе для каких процессоров
источник

E

Entusiast in Ассемблер
Да, нужно.
источник

d

disba1ancer in Ассемблер
за процессорами не бегу
источник

A

Alexandr in Ассемблер
а за памятью? говорят самсунг ддр5 уже 512ГБ планку сделала...
источник

E

Entusiast in Ассемблер
Ну как это... Задержка везде разная..
movups - 2-3 такта, 2-3 моп
movnti 8 тактов, 2 моп
источник

E

Entusiast in Ассемблер
На новеньком K10 вообще movnti может быть 26 тактов
источник

d

disba1ancer in Ассемблер
ну и нафиг ты мне его посоветовал?
источник

E

Entusiast in Ассемблер
Так не я, MSVCRT.dll использовал его
источник

DF

Dollar Føølish in Ассемблер
movnti ненад
источник

DF

Dollar Føølish in Ассемблер
они мимо кэша пишут
источник

d

disba1ancer in Ассемблер
если коротко, чтобы под старыми работало, а под новыми не тормозило
источник

E

Entusiast in Ассемблер
На старых movnti побыстрее
источник

E

Entusiast in Ассемблер
Ой, тьфу ты. Нефига, тоже медленный
Не туда глянул
источник

E

Entusiast in Ассемблер
Но таблица таблицей, вот что говорится в записях по микропроцессорам:

"When writing to a memory location that is unlikely to be accessed again soon, you may use
the non-temporal write instructions MOVNTI, etc., but excessive use of non-temporal moves
will slow down performance on P4."

"You may use MOVNTI, MOVNTQ and MOVNTPS for scattered
writes to memory if you don't expect to read again soon from the same cache line.
"
источник

d

disba1ancer in Ассемблер
а насколько быстрый rep stos?
источник

E

Entusiast in Ассемблер
Зависит от итераций
источник

d

disba1ancer in Ассемблер
а что таблицы говорят?
источник

E

Entusiast in Ассемблер
rep stos 10+n g)
С учётом, что 1 stos может занимать 3 такта, тогда:
rep stos 10+5 = 15

И
stos
stos
stos
stos
stos

Будут одинаковы по скорости, но:

rep stos 10+6 = 16

Будет уже медленнее, чем:
stos
stos
stos
stos
stos
stos
= 18
и более
источник