хочу реализовать умножение матриц4x4 на sse но пока не понимаю как лучше всего хранить ее чтобы быстро запихнуть в float4 и перемножить че посоветуете?(асемблер не предлагать)
хочу реализовать умножение матриц4x4 на sse но пока не понимаю как лучше всего хранить ее чтобы быстро запихнуть в float4 и перемножить че посоветуете?(асемблер не предлагать)
та уже попробівал 2 варика 1 варик дал ужасную производительность второй варик дал норм производительность, но он требует того чтоби матрица при умножение біла транспонирована...
та уже попробівал 2 варика 1 варик дал ужасную производительность второй варик дал норм производительность, но он требует того чтоби матрица при умножение біла транспонирована...
если так парит, что мешает использовать row-based хранение/индексацию?