Я пытаюсь оптимизировать некоторую арифметику, используя команды команд MMX и SSE с встроенной сборкой. Тем не менее, я не смог найти хорошие ссылки для таймингов и использования этих расширенных наборов инструкций. Не могли бы вы помочь мне найти ссылки, содержащие информацию о пропускной способности, задержке, операндах и, возможно, кратком описании инструкций?
До сих пор я нашел:
Список инструкций Intel Руководство разработчика Intel 64 и IA-32: Vol. 2А и Руководство разработчика Intel 64 и IA-32: Vol. 2B
Руководство по оптимизации Intel http://www.intel.com/Assets/PDF/manual/248966.pdf
Сроки выполнения целых операций http://gmplib.org/~tege/x86-timing.pdf