Вот быстрый вопрос Perl:
Как я могу преобразовать специальные символы HTML, такие как ü
или '
, в обычный текст ASCII?
Я начал с чего-то вроде этого:
s/\&#(\d+);/chr($1)/eg;
и может написать его для всех символов HTML, но некоторые функции вроде этого, вероятно, уже существуют?
Обратите внимание, что мне не нужен полный HTML- > Текстовый конвертер. Я уже разбираю HTML с помощью HTML::Parser
. Мне просто нужно преобразовать текст со специальными символами, которые я получаю.