Size: a a a

2021 August 19

V

Vladimir in ENOG
>Префетчинг делает свое дело, но проблема в том, что если мне нузны 4 байта ... из памяти придет 64 байта вместо четырех

не вижу проблемы тут. Даже если бы память отдавала контроллеру не по 64 байта, а по 4 задержка доставки этих 4 байт до ЦПУ значительно бы не уменишьлась. Единственное на что это влияет - утилизация полосы шины памяти. К счастью в современных цпу зачастую (по крайней мере в задачах обработки трафика) она не является узким местом.

>но тут другая проблема - то, что содедние два поля по 4 байта ... лежат рядом, совсем не значит, что они будут рядом на одной стоке

для этого существуют автоматические префетчеры в цпу
источник

V

Vladimir in ENOG
что касается ЛПМ и приведенного примера с "мешанием кешированию". На первый взгляд я проблемы тут не вижу, и вот почему:
При стандартном 32кб Л1 кеше с ассоциативностью 8 нам необходимо чтобы в стандартном батче на лукап у нас были адреса с паттерном a.b + 4*i.c.d - нужно попадать в одну и ту же линию кеша, выкидывая другие линии. При 32кб и 8-way assosiativity нам нужно прыгать по TBL24 с шагом в 4кб, что соответствует tbl24 энтри через каждые /14 (так как размер одной тбл24 в ЛПМ - 4 байта, знач прыгаем через 1024). Однако тут проблемы нет, так как для ЛПМ лукапа при таком паттерне распределения адресов нет пространственной локальности, и нужная тбл24 уже была прочитана к тому моменту, как кеш линия, содержащая ее была вытеснена.

>Предварительная сортировка батча помогает

я конечно не знаю какие у вас условия, но я не могу объяснить каким образом можно повысить производительность такой сортировкой, а не словить эффект наоборот.

>но более продуктивно оказывается пользовать структуру типа 8-8-8-8 или 12-4-4-4-4-8

опять таки зачастую зависит от условий, но в общем случае - нет

>если к лукапу будет еще и сбор детальной статистики

да, со статистикой все куда сложнее, не спорю
источник

V

Vladimir in ENOG
+1 :)
источник

V

Vladimir in ENOG
ОК, тогда позволь узнать почему
>но пакетная часть - она довольно ограничена в контексте параллеливания
?
источник

V

Vladimir in ENOG
ядру больнее контексты свитчить, больше регистров сейвить/ресторить
источник

V

Vladimir in ENOG
поддерживаю обоими руками
источник

p

pragus in ENOG
Только штеуд грабельки подложила в alder lake. Если такие грабли подкладывать регулярно - avx512 ещё долго будет редкостью в софте.
источник

IB

Ignas Bagdonas in ENOG
О ширине канала и о длине цикла. Более второстепенные - количество outstanding комманд, количество открытых строк, возможность отдать/принять данные не с первого адреса.
источник

DB

Dmitry Belyavskiy in ENOG
Ну их с тех пор вроде немного починили
источник

VS

Vitaly Shishkin in ENOG
Пока до массовости AVX-512 далеко.
источник

DB

Dmitry Belyavskiy in ENOG
До массовости где?
sse4 есть примерно везде на десктопе, avx2 тоже. На новых серверах avx512 есть примерно везде
источник

VS

Vitaly Shishkin in ENOG
Речь была конкретно про AVX-512, и он сейчас не везде.
источник

DB

Dmitry Belyavskiy in ENOG
Ну на серверах, купленных в конце 2019 года и не самых дорогих, он уже есть
источник

М

Максим in ENOG
и так чтобы не просаживал частоты(
источник
2021 August 23

AZ

Alexander Zubkov in ENOG
Есть кто из ГАРС тут? У клиентов от туда трассировка где-то в Мегафоне магически оседает.
источник

AZ

Alexander Zubkov in ENOG
Или из Мегафона?
источник

AZ

Alexander Zubkov in ENOG
Хотя говорят, что это одно и то же теперь.
источник

S

Sergey in ENOG
Если это мегафон, то пишите на деревне дедушке
источник

VR

Vadim Rybalko in ENOG
Гарс всё, судя по всему окончательно. Даже счета за оплату услуг уже от имени Мегафона выставляет.
источник

AZ

Alexander Zubkov in ENOG
Там вроде коллеги дозвонились куда-то, проблему решают.
источник