Я просто попытался сравнить производительность лямбда-выражений в С++ 11, поэтому я выполнил тестовую вычисление суммы элементов в векторе значений double
. Вот реализация:
#include <vector>
#include <algorithm>
#include <iostream>
#include <ctime>
#define LOG(x) { std::cout << #x << " = " << (x) << "\n"; }
#define TIME(t) { std::cout << ((double)(clock() - (t)) / CLOCKS_PER_SEC) << " s\n"; }
double sum(const std::vector<double>& v)
{
double s = 0.0;
for (auto i = v.cbegin(); i != v.cend(); ++i)
s += *i;
return s;
}
int main()
{
const size_t MAX = 1; // number of tests
const size_t SIZE = 100000000; // length of the vector
std::vector<double> v(SIZE, 1.0);
double out;
clock_t clk;
std::cout << "iterator\n";
clk = clock();
out = 0.0;
for (size_t i = 0; i < MAX; ++i)
out += sum(v);
TIME(clk)
LOG(out)
std::cout << "\nlambda\n";
clk = clock();
out = 0.0;
for (size_t i = 0; i < MAX; ++i)
std::for_each(v.cbegin(), v.cend(), [&](double d) { out += d; });
TIME(clk)
LOG(out)
return 0;
}
Вот результат этой программы (скомпилирован в VS2010 SP1, в режиме Release):
iterator 0.32 s out = 1e+008 lambda 0.326 s out = 1e+008
Как можно видеть, практически нет разницы в производительности. Однако, если я даю 10 в качестве значения MAX
(это означает, что суммирование будет выполняться в 10 раз вместо одного), результаты отличаются:
iterator 0.287 s out = 1e+009 lambda 2.84 s out = 1e+009
Тест на лямбда-выражение занимал примерно 10 раз больше времени. Зачем? Я думал, что это может быть вызвано тем фактом, что на каждой итерации создается новая лямбда, но я старался:
out = 0.0;
auto f = [&](double d) { out += d; };
for (size_t i = 0; i < MAX; ++i)
std::for_each(v.cbegin(), v.cend(), f);
результаты не изменились. Может ли кто-нибудь объяснить это поведение мне?