Использует std:: async много раз для небольших задач, дружественных к производительности?

Чтобы предоставить некоторую справочную информацию, я обрабатываю сохраненный файл, и после использования регулярного выражения для разбиения файла на его объекты-объекты мне необходимо обработать данные объекта на основе того, какой тип объекта он есть.

Моя нынешняя мысль состоит в том, чтобы использовать parallelism, чтобы получить немного прироста производительности, так как загрузка каждого объекта не зависит друг от друга. Поэтому я собирался определить функцию LoadObject, принимающую std::string для каждого типа объекта, который я буду обрабатывать, а затем вызывая std::async следующим образом:

void LoadFromFile( const std::string& szFileName )
{
     static const std::regex regexObject( "=== ([^=]+) ===\\n((?:.|\\n)*)\\n=== END \\1 ===", std::regex_constants::ECMAScript | std::regex_constants::optimize );

     std::ifstream inFile( szFileName );
     inFile.exceptions( std::ifstream::failbit | std::ifstream::badbit );

     std::string szFileData( (std::istreambuf_iterator<char>(inFile)), (std::istreambuf_iterator<char>()) );

     inFile.close();

     std::vector<std::future<void>> vecFutures;

     for( std::sregex_iterator itObject( szFileData.cbegin(), szFileData.cend(), regexObject ), end; itObject != end; ++itObject )
     {
          // Determine what type of object we're loading:
          if( (*itObject)[1] == "Type1" )
          {
               vecFutures.emplace_back( std::async( LoadType1, (*itObject)[2].str() ) );
          }
          else if( (*itObject)[1] == "Type2" )
          {
               vecFutures.emplace_back( std::async( LoadType2, (*itObject)[2].str() ) );
          }
          else
          {
               throw std::runtime_error( "Unexpected type encountered whilst reading data file." );
          }
     }

     // Make sure all our tasks completed:
     for( auto& future : vecFutures )
     {
           future.get();
     }
}

Обратите внимание, что в приложении будет более двух типов (это был только короткий пример) и потенциально тысячи объектов в файле, который нужно прочитать.

Я знаю, что создание слишком большого количества потоков часто является плохим для производительности, когда оно превосходит максимальное аппаратное обеспечение concurrency из-за контекстных переключателей, но если моя память служит мне правильно, среда выполнения С++ должна отслеживать количество потоков создал и запланировал std::async соответствующим образом (я полагаю, что в случае Microsoft их библиотека ConcRT несет ответственность за это?), поэтому приведенный выше код может по-прежнему приводить к улучшению производительности?

Спасибо заранее!

#include <future> #include <mutex> #include <cstdio> // a semaphore class // // All threads can wait on this object. When a waiting thread // is woken up, it does its work and then notifies another waiting thread. // In this way only n threads will be be doing work at any time. // class Semaphore { private: std::mutex m; std::condition_variable cv; unsigned int count; public: Semaphore(int n) : count(n) {} void notify() { std::unique_lock<std::mutex> l(m); ++count; cv.notify_one(); } void wait() { std::unique_lock<std::mutex> l(m); cv.wait(l, [this]{ return count!=0; }); --count; } }; // an RAII class to handle waiting and notifying the next thread // Work is done between when the object is created and destroyed class Semaphore_waiter_notifier { Semaphore &s; public: Semaphore_waiter_notifier(Semaphore &s) : s{s} { s.wait(); } ~Semaphore_waiter_notifier() { s.notify(); } }; // some inefficient work for our threads to do int fib(int n) { if (n<2) return n; return fib(n-1) + fib(n-2); } // for_each algorithm for iterating over a container but also // making an integer index available. // // f is called like f(index, element) template<typename Container, typename F> F for_each(Container &c, F f) { Container::size_type i = 0; for (auto &e : c) f(i++, e); return f; } // global semaphore so that lambdas don't have to capture it Semaphore thread_limiter(4); int main() { std::vector<int> input(100); for_each(input, [](int i, int &e) { e = (i%10) + 35; }); std::vector<std::future<int>> output; for_each(input, [&output](int i, int e) { output.push_back(std::async(std::launch::async, [] (int task, int n) -> int { Semaphore_waiter_notifier w(thread_limiter); std::printf("Starting task %d\n", task); int res = fib(n); std::printf("\t\t\t\t\t\tTask %d finished\n", task); return res; }, i, e)); }); for_each(output, [](int i, std::future<int> &e) { std::printf("\t\t\tWaiting on task %d\n", i); int res = e.get(); std::printf("\t\t\t\t\t\t\t\t\tTask %d result: %d\n", i, res); }); }

Ответ 1