Я хотел бы исправить некоторые текстовые данные, извлеченные из веб-страниц. Образец:
t="First sentence. Second sentence.Third sentence."
В конце второго предложения нет пробела после точки. Это означает, что 3-е предложение было в отдельной строке (после тега br) в исходном документе.
Я хочу использовать это регулярное выражение для вставки символа "\n" в нужные места и исправления моего текста. Мое регулярное выражение:
t2=t.gsub(/([.\!?])([A-Z1-9])/,$1+"\n"+$2)
Но, к сожалению, это не работает: "NoMethodError: undefined метод` + 'для nil: NilClass" Как я могу правильно отнестись к сопоставленным группам? Это было так просто в Microsoft Word, мне просто пришлось использовать символы \1 и\2.