Я пытаюсь извлечь "ЭТО МОЙ ТЕКСТ" из следующего HTML:
<html>
<body>
<table>
<td class="MYCLASS">
<!-- a comment -->
<a hef="xy">Text</a>
<p>something</p>
THIS IS MY TEXT
<p>something else</p>
</br>
</td>
</table>
</body>
</html>
Я пробовал это следующим образом:
soup = BeautifulSoup(html)
for hit in soup.findAll(attrs={'class' : 'MYCLASS'}):
print hit.text
Но я получаю весь текст между всеми вложенными тегами плюс комментарий.
Может ли кто-нибудь помочь мне просто получить "ЭТО МОЙ ТЕКСТ" из этого?