Подтвердить что ты не робот

Выравнивание типов и передача аргументов по значению

Передача выровненных типов или структур с выровненными типами по значению не работает с некоторыми реализациями. Это разбивает контейнеры STL, потому что некоторые из методов (например, изменение размера) принимают свои аргументы по значению.

Я запускаю некоторые тесты с помощью Visual Studio 2008 и не совсем уверен, когда и как проходит пропуск по значению. Моей главной задачей является функция foo. Кажется, он работает нормально, но может ли это быть результатом инкрустации или какого-то другого совпадения? Что, если я изменю свою подпись на void foo (const __m128 &)?

Ваш вклад очень ценится. Спасибо.

struct A
{
    __m128 x;
    int n;
};

void foo(__m128);
void bar(A);

void f1()
{
    // won't compile
    // std::vector<A> vec1(3);

    // compiles, but fails at runtime when elements are accessed
    std::vector<__m128> vec2(3);

    // this seems to work. WHY???
    std::vector<__m128, some_16_byte_aligned_allocator<__m128> > vec3(3);

    __m128 x;
    A a;

    // passed by value, is it OK?
    foo(x);

    // won't compile
    //bar(a);
}

ИЗМЕНИТЬ. STL не работает даже с выровненным распределителем, поскольку проблема с передачей по значению остается.

Нашел эту ссылку передать __m128 по значению

4b9b3361

Ответ 1

Я думаю, что единственный безопасный способ сделать это в целом - это пройти по ссылке. Некоторые платформы (например, Xbox 360) поддерживают передачу векторных аргументов в регистрах, но я не думаю, что это возможно на x86.

Для случая std::vector вам нужно убедиться, что выделенная память выровнена с 16 байтами; в противном случае вы получите сбои при попытке выполнить большинство операций с невыровненными векторами.

Если вы поддерживаете несколько платформ, безопасный план заключается в использовании typedef например.

typedef const MyVector& MyVectorParameter;

Затем вы можете изменить typedef на платформах, которые поддерживают векторное значение pass-by-value.

Ответ 2

часто используемая функция resize() вызывает все выравнивание и, возможно, вы можете попробовать специализировать векторный шаблон для __m128?