Это зафиксировано в Perl 5.22.1. Я пишу об этом в Perl v5.22 добавляет фантастические границы слова Unicode.
Perl v5.22 добавил утверждения Unicode из TR # 29. Я играю с утверждением границы предложения, но кажется, что он находит начало и конец текста:
use v5.22;
$_ = "See Spot. (Spot is a dog.) See Spot run. Run Spot, run!\x{2029}New paragraph.";
while( m/\b{sb}/g ) {
say "Sentence boundary at ", pos;
}
Выходные границы предложений предложений в начале и конце текста, но не после полных остановок, терминаторов предложений или паренов:
Sentence boundary at 0
Sentence boundary at 70
Unicode breaks tester показывает их в основном, я ожидаю их на основе TR # 29.
Я не мог найти никаких нетривиальных тестов в источнике perl для этой функции. Я перевариваю технический отчет для создания соответствующих тестовых примеров, но пока это выглядит как еще одна непроверенная и сломанная функция.