Я очищаю текст из нежелательных HTML-тегов (например, <script>
) с помощью
String clean = Jsoup.clean(someInput, Whitelist.basicWithImages());
Проблема заключается в том, что она заменяет, например, å
на å
(что вызывает проблемы для меня, поскольку это не "чистый xml" ).
Например
Jsoup.clean("hello å <script></script> world", Whitelist.basicWithImages())
дает
"hello å world"
но я хотел бы
"hello å world"
Есть ли простой способ достичь этого? (Т.е. проще, чем преобразование å
назад в å
в результате.)