В настоящее время я работаю над преобразованием кодов HTML с эквивалентными символами в java. Мне нужно преобразовать приведенный ниже код в символы.
è - è
® - ®
& - &
ñ - ñ
& - &
Я попытался использовать шаблон регулярного выражения
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Когда я отлаживаю, matcher.find()
дает мне true
, но элемент управления пропускает цикл, где я написал код для преобразования. Не знаю, что там происходит.
Кроме того, есть ли способ оптимизировать это регулярное выражение?
Любая помощь приветствуется.
Исключение
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)