Size: a a a

2020 September 14

YB

Yarique Belgorodsky in pro.cxx.holywars
Timur Safin
нельзя (хотел я написать)
но потом погуглил Non-temporal load https://www.felixcloutier.com/x86/movntdqa
эхъ, а я планировал https://www.felixcloutier.com/x86/vgatherdps:vgatherqps юзать иначе не векторизировать транспонирование
источник

YB

Yarique Belgorodsky in pro.cxx.holywars
хотя мб я не знаю других хаков
источник

YB

Yarique Belgorodsky in pro.cxx.holywars
скорее всего последнее))
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
Timur Safin
нельзя (хотел я написать)
но потом погуглил Non-temporal load https://www.felixcloutier.com/x86/movntdqa
ну постоянно читать не из L1, а только из кешей уровня выше, то уж точно не ускорим транспонирование
источник

CC

Chris Calvin in pro.cxx.holywars
PROLOG ONE LOVE
А если губернатор такое же чучело?
Ггвп
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
Yarique Belgorodsky
эхъ, а я планировал https://www.felixcloutier.com/x86/vgatherdps:vgatherqps юзать иначе не векторизировать транспонирование
так векторизация нужна для случая, если по вычислениям боттлнек, а при транспонировании матрицы -- боттлнек в памяти
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
@urandon Nikita Khomutov
так векторизация нужна для случая, если по вычислениям боттлнек, а при транспонировании матрицы -- боттлнек в памяти
Кек?
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
кек к какому пункту, первому или второму?
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
У тебя боттлнек по памяти в заведении второй матрицы?
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
PROLOG ONE LOVE
У тебя боттлнек по памяти в заведении второй матрицы?
не у меня, а в докладе, и не в заведении, а в заполнении
источник

YB

Yarique Belgorodsky in pro.cxx.holywars
@urandon Nikita Khomutov
так векторизация нужна для случая, если по вычислениям боттлнек, а при транспонировании матрицы -- боттлнек в памяти
нет там ботлнека по памяти)
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
Yarique Belgorodsky
нет там ботлнека по памяти)
как нет, если это ровно в латентности памяти и боттлнек)
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
Если у тебя боттлнек в памяти в транспонировании матрицы - закинь еще столько же оперативы
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
PROLOG ONE LOVE
Если у тебя боттлнек в памяти в транспонировании матрицы - закинь еще столько же оперативы
а, совет про докинуть ноду, это к @Reodont
источник

IL

Ilya L in pro.cxx.holywars
PROLOG ONE LOVE
Если у тебя боттлнек в памяти в транспонировании матрицы - закинь еще столько же оперативы
Так проблема не в количестве оперативы, а в количестве кэша
источник

CC

Chris Calvin in pro.cxx.holywars
@urandon Nikita Khomutov
а, совет про докинуть ноду, это к @Reodont
Я не всегда так делаю(
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
@urandon Nikita Khomutov
а, совет про докинуть ноду, это к @Reodont
Всегда так делаю
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
С видиухами, жалко, так не получается(
источник

YB

Yarique Belgorodsky in pro.cxx.holywars
при VGATHERDPS VMOVAPS тривиальнее обращение к памяти
источник

IL

Ilya L in pro.cxx.holywars
Ilya L
Так проблема не в количестве оперативы, а в количестве кэша
Точнее в доступе к кэшу
источник