Подтвердить что ты не робот

Невероятно основные вопросы lxml: получение содержимого HTML/string из lxml.etree._Element?

Это такой основной вопрос, который я действительно не могу найти в документах: -/

В следующем:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

Как получить HTML тега <img/>?

Я попытался добавить html_content(), но получим AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'.

Кроме того, это был тег с некоторым содержимым внутри (например, <p>text</p>), как бы получить контент (например, text)?

Большое спасибо!

4b9b3361

Ответ 1

Я предполагаю, что это будет так же просто, как:

from lxml.etree import tostring
inner_html = tostring(img)

Что касается получения содержимого изнутри <p>, скажем, для выбранного элемента el:

content = el.text_content()