Size: a a a

2020 September 14

PO

PROLOG ONE LOVE in pro.cxx.holywars
Ilya L
Так проблема не в количестве оперативы, а в количестве кэша
А
источник

IL

Ilya L in pro.cxx.holywars
мне кажется, что лучше один раз закинуть в кэш и прочитать его 8 раз
источник

IL

Ilya L in pro.cxx.holywars
чем 8 раз закинуть в кэш и прочитать его 8 раз
источник

IL

Ilya L in pro.cxx.holywars
(грубо говоря)
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
Ilya L
чем 8 раз закинуть в кэш и прочитать его 8 раз
так и есть
источник

IL

Ilya L in pro.cxx.holywars
элементарная операция заполнения матрицы ускоряется из-за сокращения издержек по доставанию данных из оперативы
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
Так, мы какие матрицы рассматриваем?
источник

IL

Ilya L in pro.cxx.holywars
так что это нормальный хак
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
потому что вычислительное ядро на порядки быстрее работает даже L1 кеша
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
Спарсовые?
источник

YB

Yarique Belgorodsky in pro.cxx.holywars
@urandon Nikita Khomutov
как нет, если это ровно в латентности памяти и боттлнек)
да, ты прав) чёт тупанул переключая контекст с галерных перетаскований proto
источник

IL

Ilya L in pro.cxx.holywars
PROLOG ONE LOVE
Так, мы какие матрицы рассматриваем?
полагаю не разряженные или ты про что?
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
Ilya L
полагаю не разряженные или ты про что?
Про них как раз
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
Вот со спарсовыми нихера не сделаешь
источник

IL

Ilya L in pro.cxx.holywars
@urandon Nikita Khomutov
потому что вычислительное ядро на порядки быстрее работает даже L1 кеша
поясни, чет не понял в чем связь с транспонированием
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
С неспасрсовыми легче
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
Мы там можем трюков с реверсом по логу напроводить
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
Ilya L
поясни, чет не понял в чем связь с транспонированием
в простом транспонировании нет особо связи, а вот при транспорировании и выполнении поэлементной операции есть
источник

PO

PROLOG ONE LOVE in pro.cxx.holywars
И засчет этого иметь околоцельные куски
источник

@N

@urandon Nikita Khom... in pro.cxx.holywars
если операция быстрая, то CPU всё ещё не боттлнек
источник