Подтвердить что ты не робот

Безглавой браузер для Python (поддержка Javascript ТРЕБУЕТСЯ!)

Мне нужен безголовый браузер, который довольно прост в использовании (я до сих пор довольно новичок в Python и вообще программировании), который позволит мне перейти на страницу, войти в форму, которая требует Javascript, а затем очистить полученный результат веб-страницы, выполнив поиск результатов, соответствующих определенным критериям, щелкнув флажки и щелкнув, чтобы загрузить файлы. Все это требует Javascript.

Я слышал, что безголовый браузер - это то, что я хочу - требования/предпочтения в том, что я могу запустить его с Python, и желательно, чтобы результирующий script был скомпилирован py2exe (я пишу эту программу для других пользователей).

Пока Ветряная мельница выглядит так, ЧТО Я хочу, но я не уверен.

Любые идеи оценены!

4b9b3361

Ответ 1

Ответ на этот вопрос был Spynner

Ответ 2

Я использую webkit как безгласный браузер в Python через pyqt/pyside:
http://www.riverbankcomputing.co.uk/software/pyqt/download
http://developer.qt.nokia.com/wiki/Category:LanguageBindings::PySide::Downloads

Мне особенно нравится webkit, потому что он прост в настройке. Для Ubuntu вы просто используете: sudo apt-get install python-qt4

Вот пример script:
http://webscraping.com/blog/Scraping-JavaScript-webpages-with-webkit/

Ответ 3

Я посреди написания драйвера Python для Zombie.js, "облегченной рамки для тестирования кода JavaScript на стороне клиента в моделируемой среде".

В настоящее время я нахожусь в тупике с разрешением на ошибку в Node.js(прежде чем писать больше тестов и больше кода), но не стесняйтесь следить за моим проектом по мере его продвижения:

https://github.com/ryanpetrello/python-zombie

Ответ 4

Есть не так много браузеров без браузера, которые поддерживают Javascript.

Вы можете попробовать Zombie.js или Phantomjs. Это не Python, а простой Javascript, и они действительно могут выполнить эту работу.

Ответ 5

Попробуйте использовать phantomjs, он отлично поддерживает javascript. Затем вы можете запустить его как подпроцесс python script

http://docs.python.org/library/subprocess.html

который мог бы его обмануть.

Ответ 6

Вы можете использовать HTQL в сочетании с webscraper IRobotSoft. Здесь приведены примеры: http://htql.net/