Из того, что я могу понять, две основные библиотеки разбора HTML в Python - это lxml и BeautifulSoup. Я выбрал BeautifulSoup для проекта, над которым я работаю, но я выбрал его не по какой-либо причине, кроме как найти синтаксис, который немного легче изучить и понять. Но я вижу, что многие люди предпочитают lxml, и я слышал, что lxml работает быстрее.
Так что я задаюсь вопросом, каковы преимущества одного над другим? Когда я хочу использовать lxml и когда мне лучше использовать BeautifulSoup? Есть ли другие библиотеки, которые стоит рассмотреть?