Почему векторизация ведет себя по-разному для почти одного и того же кода? - программирование

Почему векторизация ведет себя по-разному для почти одного и того же кода?

Вот свободные функции, которые делают то же самое, но в первом случае цикл не векторизован, а в других случаях он есть. Почему это?

#include <vector>

typedef std::vector<double> Vec;

void update(Vec& a, const Vec& b, double gamma) {
    const size_t K = a.size();
    for (size_t i = 0; i < K; ++i) { // not vectorized
        a[i] = b[i] * gamma - a[i];
    }
}

void update2(Vec& a, const Vec& b, double gamma) {
    for (size_t i = 0; i < a.size(); ++i) { // vectorized
        a[i] = b[i] * gamma - a[i];
    }
}

void update3(Vec& a, size_t K, const Vec& b, double gamma) {
    for (size_t i = 0; i < K; ++i) { // vectorized
        a[i] = b[i] * gamma - a[i];
    }
}

int main(int argc, const char* argv[]) {
    Vec a(argc), b;
    update(a, b, 0.5);
    update2(a, b, 0.5);
    update3(a, a.size(), b, 0.5);
    return 0;
}

Соответствующие сообщения от компилятора (VS2013):

1>  c:\home\dima\trws\trw_s-v1.3\trws\test\vector.cpp(7) : info C5002: loop not vectorized due to reason '1200'
1>  c:\home\dima\trws\trw_s-v1.3\trws\test\vector.cpp(13) : info C5001: loop vectorized
1>  c:\home\dima\trws\trw_s-v1.3\trws\test\vector.cpp(19) : info C5001: loop vectorized

Из комментария @tony

Причина 1200: "Цикл содержит связанные с петлями данные, которые предотвращают векторизации. Различные итерации петли мешают каждому другие такие, что векторизация цикла приведет к неправильным ответам и автоинтервализатор не может доказать себе, что таких данных нет зависимостей." источник

4b9b3361

Ответ 1

Я думаю, что это связано с многочисленным доступом к константной переменной k, которая ограничивает цель SIMD, поскольку каждая команда должна извлекать константную переменную k