Подтвердить что ты не робот

Regex заменить на callback в С++ 11?

Есть ли функция замены регулярных выражений, которая отправит совпадения в пользовательскую функцию, а затем заменит возвращаемое значение:

Я пробовал этот метод, но он явно не работает:

cout << regex_replace("my values are 9, 19", regex("\d+"), my_callback);

и функция:

std::string my_callback(std::string &m) {
  int int_m = atoi(m.c_str());
  return std::to_string(int_m + 1);
}

и результат должен быть: my values are 10, 20

Я имею в виду аналогичный режим работы, например php preg_replace_callback или python re.sub(pattern, callback, subject)

И я имею в виду последний 4.9 gcc, способный к регулярному выражению без повышения.

4b9b3361

Ответ 1

Я хотел такую функцию, и мне не понравился ответ "используй буст". Проблема с ответом Бенджамина в том, что он предоставляет все токены. Это означает, что вы не знаете, какой токен совпадает, и он не позволяет использовать группы захвата. Это делает:

// clang++ -std=c++11 -stdlib=libc++ -o test test.cpp
#include <cstdlib>
#include <iostream>
#include <string>
#include <regex>

namespace std
{

template<class BidirIt, class Traits, class CharT, class UnaryFunction>
std::basic_string<CharT> regex_replace(BidirIt first, BidirIt last,
    const std::basic_regex<CharT,Traits>& re, UnaryFunction f)
{
    std::basic_string<CharT> s;

    typename std::match_results<BidirIt>::difference_type
        positionOfLastMatch = 0;
    auto endOfLastMatch = first;

    auto callback = [&](const std::match_results<BidirIt>& match)
    {
        auto positionOfThisMatch = match.position(0);
        auto diff = positionOfThisMatch - positionOfLastMatch;

        auto startOfThisMatch = endOfLastMatch;
        std::advance(startOfThisMatch, diff);

        s.append(endOfLastMatch, startOfThisMatch);
        s.append(f(match));

        auto lengthOfMatch = match.length(0);

        positionOfLastMatch = positionOfThisMatch + lengthOfMatch;

        endOfLastMatch = startOfThisMatch;
        std::advance(endOfLastMatch, lengthOfMatch);
    };

    std::regex_iterator<BidirIt> begin(first, last, re), end;
    std::for_each(begin, end, callback);

    s.append(endOfLastMatch, last);

    return s;
}

template<class Traits, class CharT, class UnaryFunction>
std::string regex_replace(const std::string& s,
    const std::basic_regex<CharT,Traits>& re, UnaryFunction f)
{
    return regex_replace(s.cbegin(), s.cend(), re, f);
}

} // namespace std

using namespace std;

std::string my_callback(const std::smatch& m) {
  int int_m = atoi(m.str(0).c_str());
  return std::to_string(int_m + 1);
}

int main(int argc, char *argv[])
{
    cout << regex_replace("my values are 9, 19", regex("\\d+"),
        my_callback) << endl;

    cout << regex_replace("my values are 9, 19", regex("\\d+"),
        [](const std::smatch& m){
            int int_m = atoi(m.str(0).c_str());
            return std::to_string(int_m + 1);
        }
    ) << endl;

    return 0;
}

Ответ 2

Вы можете использовать regex_token_iterator

#include <iostream>
#include <algorithm>
#include <regex>
#include <string>
#include <sstream>

int main()
{
    std::string input_text = "my values are 9, 19";
    std::string output_text;
    auto callback = [&](std::string const& m){
        std::istringstream iss(m);
        int n;
        if(iss >> n)
        {
            output_text += std::to_string(n+1);
        }
        else
        {
            output_text += m;
        }
    };

    std::regex re("\\d+");
    std::sregex_token_iterator
        begin(input_text.begin(), input_text.end(), re, {-1,0}),
        end;
    std::for_each(begin,end,callback);

    std::cout << output_text;
}

Обратите внимание, что {-1,0} в списке аргументов конструктора итератора представляет собой список, определяющий подматрицы, которые мы хотим перебрать. -1 предназначен для несовпадающих разделов, а 0 - для первого подгрузки.

Также обратите внимание, что я не использовал функциональность regex С++ 11 и не стал экспертом в ней. Таким образом, могут возникнуть проблемы с этим кодом. Но для вашего конкретного ввода я протестировал его и, похоже, получил ожидаемые результаты. Если вы найдете какой-либо набор ввода, для которого он не работает, сообщите мне.

Ответ 3

Может быть, я приехал на эту вечеринку слишком поздно (подумалось около 5 лет), но мне не понравился ответ "use boost", следующая функция имеет меньшее обобщение (говоря о типах строк), но, видимо, работает. Однако я не знаю, лучше ли использовать std::ostringstream, чем std::string::append:

std::string regex_replace(
    const std::string& input,
    const std::regex& regex, 
    std::function<std::string(std::smatch const& match)> format) {

    std::ostringstream output;
    std::sregex_iterator begin(input.begin(), input.end(), regex), end;
    for(; begin != end; begin++){
        output << begin->prefix() << format(*begin);
    }
    output << input.substr(input.size() - begin->position());
    return output.str();
}

Итак, как вы можете видеть, я использовал std::sregex_iterator вместо std::sregex_token_iterator.

Ответ 4

Такая функциональность существует только в версии Boost версии regex_replace, которая может иметь собственный форматтер. К сожалению, стандартная реализация С++ 11 требует, чтобы аргумент замены был строкой.

Вот документация по regex_replace: http://www.cplusplus.com/reference/regex/match_replace/