Мне нужно запустить умножение матрицы-вектора 240000 раз в секунду. Матрица 5x5 и всегда одна и та же, а вектор меняется на каждой итерации. Тип данных - float. Я думал использовать некоторые SSE (или подобные) инструкции.
1) Я обеспокоен тем, что число арифметических операций слишком мало по сравнению с количеством операций с памятью. Как вы думаете, я могу улучшить некоторые улучшения (например, > 20%)?
2) Нужен ли мне компилятор Intel для этого?
3) Можете ли вы указать некоторые ссылки?
Спасибо всем!