что касается ЛПМ и приведенного примера с "мешанием кешированию". На первый взгляд я проблемы тут не вижу, и вот почему:
При стандартном 32кб Л1 кеше с ассоциативностью 8 нам необходимо чтобы в стандартном батче на лукап у нас были адреса с паттерном a.b + 4*i.c.d - нужно попадать в одну и ту же линию кеша, выкидывая другие линии. При 32кб и 8-way assosiativity нам нужно прыгать по TBL24 с шагом в 4кб, что соответствует tbl24 энтри через каждые /14 (так как размер одной тбл24 в ЛПМ - 4 байта, знач прыгаем через 1024). Однако тут проблемы нет, так как для ЛПМ лукапа при таком паттерне распределения адресов нет пространственной локальности, и нужная тбл24 уже была прочитана к тому моменту, как кеш линия, содержащая ее была вытеснена.
>Предварительная сортировка батча помогает
я конечно не знаю какие у вас условия, но я не могу объяснить каким образом можно повысить производительность такой сортировкой, а не словить эффект наоборот.
>но более продуктивно оказывается пользовать структуру типа 8-8-8-8 или 12-4-4-4-4-8
опять таки зачастую зависит от условий, но в общем случае - нет
>если к лукапу будет еще и сбор детальной статистики
да, со статистикой все куда сложнее, не спорю