htmlentitydefs задокументирован, но требует, чтобы вы выполняли большую часть работы самостоятельно.
Если вам нужны только предопределенные сущности XML (lt, gt, amp, quot, apos), вы можете использовать мини-диск для их анализа. Если вам нужны только предопределенные сущности и нет числовых ссылок на символы, вы можете просто использовать обычную замену старой строки для скорости.
Ответ 2
Я забыл пометить его сначала, но я использую BeautifulSoup.