В настоящее время я работаю над функцией, которая включает в себя синтаксический анализ XML, который мы получаем от другого продукта. Я решил провести некоторые тесты против некоторых фактических данных о клиентах, и похоже, что другой продукт позволяет вводить данные от пользователей, которые считаются недействительными. В любом случае, мне все еще нужно попытаться выяснить, как его разобрать. Мы используем javax.xml.parsers.DocumentBuilder
, и я получаю сообщение об ошибке, которое выглядит следующим образом.
<xml>
...
<description>Example:Description:<THIS-IS-PART-OF-DESCRIPTION></description>
...
</xml>
Как вы можете сказать, в описании есть то, что внутри него является недопустимым тегом (<THIS-IS-PART-OF-DESCRIPTION>
). Теперь этот тег описания, как известно, является листовым тегом и не должен иметь внутри него вложенных тегов. Несмотря на это, это все еще проблема и дает исключение на DocumentBuilder.parse(...)
Я знаю, что это недопустимый XML, но он предсказуемо недействителен. Любые идеи о способе анализа такого ввода?