Подтвердить что ты не робот

Какие библиотеки разбора HTML вы рекомендуете в Java

Я хочу проанализировать некоторый HTML, чтобы найти значения некоторых атрибутов/тэгов и т.д.

Какие HTML-парсеры вы рекомендуете? Любые плюсы и минусы?

4b9b3361

Ответ 1

NekoHTML, TagSoup, и JTidy позволит вам анализировать HTML, а затем обрабатывать с помощью XML-инструментов, таких как XPath.

Ответ 2

Я пробовал HTML Parser, который прост.

Ответ 3

Вам нужно сделать полный анализ HTML? Если вы просто ищете определенные значения в содержимом (конкретный тег/параметр), то простого регулярного выражения может быть достаточно, и он может быть очень быстрым.