Я бы хотел написать фрагмент кода, который бы захватил весь текст внутри тега <content>
в lxml во всех трех экземплярах ниже, включая теги кода. Я пробовал tostring(getchildren())
, но это пропустило бы текст между тегами. Мне не очень повезло в поиске API для соответствующей функции. Не могли бы вы мне помочь?
<!--1-->
<content>
<div>Text inside tag</div>
</content>
#should return "<div>Text inside tag</div>
<!--2-->
<content>
Text with no tag
</content>
#should return "Text with no tag"
<!--3-->
<content>
Text outside tag <div>Text inside tag</div>
</content>
#should return "Text outside tag <div>Text inside tag</div>"