Подтвердить что ты не робот

Как преобразовать документ, сделанный в Jsoup (Java html parser) в строку

У меня есть документ, который был создан в jsoup, который выглядит как

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

Как преобразовать этот doc в строку.

4b9b3361

Ответ 1

Вы пробовали:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

Поскольку документ расширяет элемент, он также получил метод html(), который "получает внутренний HTML-элемент" в соответствии с API. Так что это должно работать:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

Дополнительная информация:

Каждый объект Document получает ссылку на экземпляр внутреннего класса Document.OutputSettings, к которому можно получить доступ через метод outputSettings() документа. Там вы можете включить/отключить красивую печать, используя setter prettyPrint (true/false). См. API для документа и документа. Параметры вывода для дальнейшей информации.

Ответ 2

doc.toString() работает, как и doc.outerHtml().

Ответ 3

 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

После разбора строки на документ вы можете использовать на нем функции документа

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);