Подтвердить что ты не робот

Открыть браузер с селеном

Можно ли использовать селен в браузере TOR? У кого-нибудь есть код, который они могли бы скопировать-вставить?

4b9b3361

Ответ 1

Не используйте TBB, просто установите правильные настройки прокси в любом браузере, который вы используете. Например, в FF:

#set some privacy settings
ff_prof.set_preference( "places.history.enabled", False )
ff_prof.set_preference( "privacy.clearOnShutdown.offlineApps", True )
ff_prof.set_preference( "privacy.clearOnShutdown.passwords", True )
ff_prof.set_preference( "privacy.clearOnShutdown.siteSettings", True )
ff_prof.set_preference( "privacy.sanitize.sanitizeOnShutdown", True )
ff_prof.set_preference( "signon.rememberSignons", False )
ff_prof.set_preference( "network.cookie.lifetimePolicy", 2 )
ff_prof.set_preference( "network.dns.disablePrefetch", True )
ff_prof.set_preference( "network.http.sendRefererHeader", 0 )

#set socks proxy
ff_prof.set_preference( "network.proxy.type", 1 )
ff_prof.set_preference( "network.proxy.socks_version", 5 )
ff_prof.set_preference( "network.proxy.socks", '127.0.0.1' )
ff_prof.set_preference( "network.proxy.socks_port", 9050 )
ff_prof.set_preference( "network.proxy.socks_remote_dns", True )

#if you're really hardcore about your security
#js can be used to reveal your true i.p.
ff_prof.set_preference( "javascript.enabled", False )

#get a huge speed increase by not downloading images
ff_prof.set_preference( "permissions.default.image", 2 )

##
# programmatically start tor (in windows environment)
##
tor_path = "C:\\this\\is\\the\\location\\of\\" #tor.exe
torrc_path = "C:\\you\\need\\to\\create\\this\\file\\torrc"

DETACHED_PROCESS = 0x00000008
#calling as a detached_process means the program will not die with your python program - you will need to manually kill it
##
# somebody please let me know if there a way to make this a child process that automatically dies (in windows)
##
tor_process = subprocess.Popen( '"' + tor_path+'tor.exe" --nt-service "-f" "' + torrc_path + '"', creationflags=DETACHED_PROCESS )

#attach to tor controller
## imports ##
# import stem.socket
# import stem.connection
# import stem.Signal
##
tor_controller = stem.socket.ControlPort( port=9051 )

control_password = 'password'
#in your torrc, you need to store the hashed version of 'password' which you can get with: subprocess.call( '"' + tor_path+'tor.exe" --hash-password %s' %control_password )

stem.connection.authenticate( tor_controller, password=control_password )

#check that everything is good with your tor_process by checking bootstrap status
tor_controller.send( 'GETINFO status/bootstrap-phase' )
response = worker.tor_controller.recv()
response = response.content()

#I will leave handling of response status to you

Ответ 2

//просто проверьте номер порта вашего браузера и измените его соответственно в //code

from selenium import webdriver
profile=webdriver.FirefoxProfile()
profile.set_preference('network.proxy.type', 1)
profile.set_preference('network.proxy.socks', '127.0.0.1')
profile.set_preference('network.proxy.socks_port', 9150)
browser=webdriver.Firefox(profile)
browser.get("http://yahoo.com")
browser.save_screenshot("screenshot.png")
browser.close()

Ответ 3

Да, можно использовать селен в браузере TOR.

Я смог сделать это как на Ubuntu, так и на Mac OS X.

Должны произойти две вещи:

  • Задайте двоичный путь к двоичному файлу firefox, который использует Tor. На Mac этот путь обычно будет /Applications/TorBrowser.app/Contents/MacOS/firefox. На моей машине Ubuntu это /usr/bin/tor-browser/Browser/firefox.

  • Браузер Tor использует хост SOCKS в 127.0.0.1:9150 либо через установку Vidalia, либо Tor. Запустите Tor один раз из Finder и оставьте его открытым, чтобы Vidalia работала. Случаи, запущенные с помощью селена, будут использовать хост SOCKS, который тоже запускает Vidalia.

Вот код для выполнения этих двух вещей. Я запускаю это в Mac OS X Yosemite:

import os
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
from selenium import webdriver


# path to the firefox binary inside the Tor package
binary = '/Applications/TorBrowser.app/Contents/MacOS/firefox'
if os.path.exists(binary) is False:
    raise ValueError("The binary path to Tor firefox does not exist.")
firefox_binary = FirefoxBinary(binary)


browser = None
def get_browser(binary=None):
    global browser  
    # only one instance of a browser opens, remove global for multiple instances
    if not browser: 
        browser = webdriver.Firefox(firefox_binary=binary)
    return browser

if __name__ == "__main__":
    browser = get_browser(binary=firefox_binary)
    urls = (
        ('tor browser check', 'https://check.torproject.org/'),
        ('ip checker', 'http://icanhazip.com')
    )
    for url_name, url in urls:
        print "getting", url_name, "at", url
        browser.get(url)

В системе Ubuntu я смог запустить браузер Tor через селен. Эта машина работает на порту 9051 и приваси HTTP-прокси, который использует tor на порту 8118. Для того, чтобы браузер Tor передал страницу проверки tor, мне пришлось установить http-прокси для privoxy.

from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
from selenium.webdriver.common.proxy import Proxy, ProxyType
from selenium import webdriver
browser = None

proxy_address = "127.0.0.1:8118"
proxy = Proxy({
    'proxyType': ProxyType.MANUAL,
    'httpProxy': proxy_address,
})

tor = '/usr/bin/tor-browser/Browser/firefox'
firefox_binary = FirefoxBinary(tor)

urls = (
    ('tor_browser_check', 'https://check.torproject.org/'),
    ('icanhazip', 'http://icanhazip.com'),
)
keys, _ = zip(*urls)
urls_map = dict(urls)

def get_browser(binary=None, proxy=None):
    global browser
    if not browser:
        browser = webdriver.Firefox(firefox_binary=binary, proxy=proxy)
    return browser

if __name__ == "__main__":
    browser = get_browser(binary=firefox_binary, proxy=proxy)
    for resource in keys:
        browser.get(urls_map.get(resource))

Ответ 4

from selenium import webdriver
from selenium.webdriver.firefox.firefox_profile import FirefoxProfile
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary

#path to TOR binary
binary = FirefoxBinary(r'...\Tor Browser\Browser\firefox.exe')
#path to TOR profile
profile = FirefoxProfile(r'...\Tor Browser\Browser\TorBrowser\Data\Browser\profile.default')

driver = webdriver.Firefox(firefox_profile= profile, firefox_binary= binary)
driver.get("http://icanhazip.com")
driver.save_screenshot("screenshot.png")
driver.quit()

Использование Python 3.5.1 в Windows 10

Ответ 5

Использование ruby,

profile = Selenium::WebDriver::Firefox::Profile.new
profile.proxy = Selenium::WebDriver::Proxy.new :socks => '127.0.0.1:9050' #port where TOR runs
browser = Watir::Browser.new :firefox, :profile => profile

Чтобы подтвердить, что вы используете Tor, используйте https://check.torproject.org/

Ответ 6

Я изучил это, и, если я не ошибаюсь, по номиналу это невозможно.

Причина этого не может быть вызвана тем, что:

  • Tor Browser основан на коде Firefox.
  • У браузера Tor есть определенные исправления для кода Firefox, чтобы предотвратить взаимодействие внешних приложений с Tor Browser (включая блокировку библиотеки Components.Interfaces).
  • Selenium Firefox WebDriver взаимодействует с браузером через библиотеки Javascript, которые, как уже упоминалось, блокируются браузером Tor.

Это, по-видимому, так, что никто за пределами браузера Tor ни на вашем ящике, ни через интернет не знает о вашем просмотре.

Ваши альтернативы:

  • Использовать прокси-сервер Tor через Firefox вместо Tor Browser (см. ссылку в комментариях к вопросу).
  • Восстановите исходный код Firefox с помощью патчей Tor Browser, за исключением тех, которые предотвращают внешнюю связь с Tor Browser.

Я предлагаю первое.

Ответ 7

В качестве более новой альтернативы Selenium, которая управляет только Firefox, посмотрите Marionette. Чтобы использовать браузер Tor, включите марионетку при запуске через

Browser/firefox -marionette

(внутри расслоения). Затем вы можете подключиться через

from marionette import Marionette
client = Marionette('localhost', port=2828);
client.start_session()

и загрузите новую страницу, например, через

url='http://mozilla.org'
client.navigate(url);

Для получения дополнительных примеров существует учебник.


Более старый ответ

Проект Tor имеет селеновый тест для своего браузера. Он работает как:

from selenium import webdriver
ffbinary = webdriver.firefox.firefox_binary.FirefoxBinary(firefox_path=os.environ['TBB_BIN'])
ffprofile = webdriver.firefox.firefox_profile.FirefoxProfile(profile_directory=os.environ['TBB_PROFILE'])
self.driver = webdriver.Firefox(firefox_binary=ffbinary, firefox_profile=ffprofile)
self.driver.implicitly_wait(30)
self.base_url = "about:tor"
self.verificationErrors = []
self.accept_next_alert = True
self.driver.get("http://check.torproject.org/")
self.assertEqual("Congratulations. This browser is configured to use Tor.", driver.find_element_by_css_selector("h1.on").text)

Как вы видите, это использует переменные среды TBB_BIN и TBB_PROFILE для пакета и профиля браузера. Возможно, вы сможете жестко закодировать их в своем коде.