Я занимаюсь обработкой изображений на C, которая требует копирования больших фрагментов данных вокруг памяти - источник и место назначения никогда не перекрываются.
Каков самый быстрый способ сделать это на платформе x86 с помощью GCC (где SSE, SSE2, но не SSE3)?
Я ожидаю, что решение будет либо в сборе, либо с использованием свойств GCC?
Я нашел следующую ссылку, но понятия не имею, лучше ли это сделать (автор также говорит, что у нее несколько ошибок): http://coding.derkeiler.com/Archive/Assembler/comp.lang.asm.x86/2006-02/msg00123.html
EDIT: обратите внимание, что необходима копия, я не могу обойтись, чтобы скопировать данные (я мог бы объяснить, почему, но я пощажу вам объяснение:))