Подтвердить что ты не робот

Как анализировать HTML с помощью PHP?

Возможный дубликат:
Как анализировать и обрабатывать HTML с помощью PHP?

Предложение для справочного вопроса. У есть десятки вопросов "Как разобрать HTML", которые появляются каждый день. Тем не менее, это очень сложно закрыть как дубликат, потому что большинство вопросов касаются конкретного сценария, представленного апеллятором. Этот вопрос является попыткой построить общий "справочный вопрос", который охватывает все аспекты проблемы.

Это эксперимент. Если такой ссылочный вопрос уже существует, дайте мне знать, и я с радостью удалю этот.

Мое идеальное видение состоит в том, что каждый из трех вопросов получает ответ отдельно, и лучшие ответы на каждый пузырь вверх.

Я буду награждать 200 баунти лучшим ответом в каждой из трех категорий через две недели, ожидающий обсуждение этого вопроса на Meta​​strong > .

Каждый из этих вопросов уже получил блестящий ответ в другом месте, поэтому копирование + вставка собственного ответа на другой вопрос в порядке со мной.

Как анализировать HTML с помощью PHP?

  • Какие библиотеки существуют? Какие из них используют PHP DOM, которые имеют собственный механизм синтаксического анализа? (Подсказка: SimpleHTMLDOM)

    1а. Мне нужно найти определенный элемент, но мне трудно привыкнуть к синтаксису XPath. Существуют ли библиотеки на основе DOM, которые упрощают анализ HTML? Пожалуйста, подумайте о том, чтобы создать общие примеры в реальном мире.

  • Есть ли библиотека PHP, которая позволяет мне запрашивать DOM с помощью селекторов CSS [2/3], например jQuery? (Подсказка: phpQuery). Пожалуйста, подумайте о том, чтобы создать общие примеры в реальном мире.

  • Бонусный вопрос: почему я не должен использовать регулярные выражения? Пожалуйста, предоставьте очень короткий ответ в условиях неспециалиста.

4b9b3361