Подтвердить что ты не робот

Снижение производительности с использованием ключевого слова "auto" в Visual Studio 2010

Использование нового ключевого слова auto ухудшило время выполнения кода. Я сузил проблему до следующего простого фрагмента кода:

#include <iostream>
#include <map>
#include <vector>
#include <deque>
#include <time.h>

using namespace std;

void func1(map<int, vector<deque<float>>>& m)
{
    vector<deque<float>>& v = m[1];
}

void func2(map<int, vector<deque<float>>>& m)
{
    auto v = m[1];
}

void main () {

    map<int, vector<deque<float>>> m;
    m[1].push_back(deque<float>(1000,1));

    clock_t begin=clock();
    for(int i = 0; i < 100000; ++i) func1(m);
    cout << "100000 x func1: " << (((double)(clock() - begin))/CLOCKS_PER_SEC) << " sec." << endl;

    begin=clock();
    for(int i = 0; i < 100000; ++i) func2(m);
    cout << "100000 x func2: " << (((double)(clock() - begin))/CLOCKS_PER_SEC) << " sec." << endl;

}

Выход, который я получаю на моей машине i7/Win7 (режим Release; VS2010):

100000 x func1: 0.001 sec.
100000 x func2: 3.484 sec.

Может ли кто-нибудь объяснить, почему использование auto приводит к таким различным временам выполнения?

Очевидно, что существует простой способ обхода, т.е. вообще отказаться от использования auto, но я надеюсь, что есть лучший способ преодолеть эту проблему.

4b9b3361

Ответ 1

Вы копируете вектор в v.

Попробуйте вместо этого создать ссылку

auto& v = ...

Ответ 2

Как сказал Бо, вы должны использовать auto& вместо auto (обратите внимание, что есть и auto* для других случаев). Вот обновленная версия вашего кода:

#include <functional>
#include <iostream>
#include <map>
#include <vector>
#include <deque>
#include <time.h>

using namespace std;

typedef map<int, vector<deque<float>>> FooType; // this should have a meaningful name

void func1(FooType& m)
{
    vector<deque<float>>& v = m[1];
}

void func2(FooType& m)
{
    auto v = m[1];
}

void func3(FooType& m)
{
    auto& v = m[1];
}

void measure_time(std::function<void(FooType&)> func, FooType& m)
{
    clock_t begin=clock();
    for(int i = 0; i < 100000; ++i) func(m);
    cout << "100000 x func: " << (((double)(clock() - begin))/CLOCKS_PER_SEC) << " sec." << endl;
}

void main()
{
    FooType m;
    m[1].push_back(deque<float>(1000,1));

    measure_time(func1, m);
    measure_time(func2, m);
    measure_time(func3, m);
}

На моем компьютере он дает следующий вывод:

100000 x func: 0 sec.
100000 x func: 3.136 sec.
100000 x func: 0 sec.