Можно ли использовать селен в браузере TOR? У кого-нибудь есть код, который они могли бы скопировать-вставить?
Открыть браузер с селеном
Ответ 1
Не используйте TBB, просто установите правильные настройки прокси в любом браузере, который вы используете. Например, в FF:
#set some privacy settings
ff_prof.set_preference( "places.history.enabled", False )
ff_prof.set_preference( "privacy.clearOnShutdown.offlineApps", True )
ff_prof.set_preference( "privacy.clearOnShutdown.passwords", True )
ff_prof.set_preference( "privacy.clearOnShutdown.siteSettings", True )
ff_prof.set_preference( "privacy.sanitize.sanitizeOnShutdown", True )
ff_prof.set_preference( "signon.rememberSignons", False )
ff_prof.set_preference( "network.cookie.lifetimePolicy", 2 )
ff_prof.set_preference( "network.dns.disablePrefetch", True )
ff_prof.set_preference( "network.http.sendRefererHeader", 0 )
#set socks proxy
ff_prof.set_preference( "network.proxy.type", 1 )
ff_prof.set_preference( "network.proxy.socks_version", 5 )
ff_prof.set_preference( "network.proxy.socks", '127.0.0.1' )
ff_prof.set_preference( "network.proxy.socks_port", 9050 )
ff_prof.set_preference( "network.proxy.socks_remote_dns", True )
#if you're really hardcore about your security
#js can be used to reveal your true i.p.
ff_prof.set_preference( "javascript.enabled", False )
#get a huge speed increase by not downloading images
ff_prof.set_preference( "permissions.default.image", 2 )
##
# programmatically start tor (in windows environment)
##
tor_path = "C:\\this\\is\\the\\location\\of\\" #tor.exe
torrc_path = "C:\\you\\need\\to\\create\\this\\file\\torrc"
DETACHED_PROCESS = 0x00000008
#calling as a detached_process means the program will not die with your python program - you will need to manually kill it
##
# somebody please let me know if there a way to make this a child process that automatically dies (in windows)
##
tor_process = subprocess.Popen( '"' + tor_path+'tor.exe" --nt-service "-f" "' + torrc_path + '"', creationflags=DETACHED_PROCESS )
#attach to tor controller
## imports ##
# import stem.socket
# import stem.connection
# import stem.Signal
##
tor_controller = stem.socket.ControlPort( port=9051 )
control_password = 'password'
#in your torrc, you need to store the hashed version of 'password' which you can get with: subprocess.call( '"' + tor_path+'tor.exe" --hash-password %s' %control_password )
stem.connection.authenticate( tor_controller, password=control_password )
#check that everything is good with your tor_process by checking bootstrap status
tor_controller.send( 'GETINFO status/bootstrap-phase' )
response = worker.tor_controller.recv()
response = response.content()
#I will leave handling of response status to you
Ответ 2
//просто проверьте номер порта вашего браузера и измените его соответственно в //code
from selenium import webdriver
profile=webdriver.FirefoxProfile()
profile.set_preference('network.proxy.type', 1)
profile.set_preference('network.proxy.socks', '127.0.0.1')
profile.set_preference('network.proxy.socks_port', 9150)
browser=webdriver.Firefox(profile)
browser.get("http://yahoo.com")
browser.save_screenshot("screenshot.png")
browser.close()
Ответ 3
Да, можно использовать селен в браузере TOR.
Я смог сделать это как на Ubuntu, так и на Mac OS X.
Должны произойти две вещи:
-
Задайте двоичный путь к двоичному файлу firefox, который использует Tor. На Mac этот путь обычно будет
/Applications/TorBrowser.app/Contents/MacOS/firefox
. На моей машине Ubuntu это/usr/bin/tor-browser/Browser/firefox
. -
Браузер Tor использует хост SOCKS в 127.0.0.1:9150 либо через установку Vidalia, либо Tor. Запустите Tor один раз из Finder и оставьте его открытым, чтобы Vidalia работала. Случаи, запущенные с помощью селена, будут использовать хост SOCKS, который тоже запускает Vidalia.
Вот код для выполнения этих двух вещей. Я запускаю это в Mac OS X Yosemite:
import os
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
from selenium import webdriver
# path to the firefox binary inside the Tor package
binary = '/Applications/TorBrowser.app/Contents/MacOS/firefox'
if os.path.exists(binary) is False:
raise ValueError("The binary path to Tor firefox does not exist.")
firefox_binary = FirefoxBinary(binary)
browser = None
def get_browser(binary=None):
global browser
# only one instance of a browser opens, remove global for multiple instances
if not browser:
browser = webdriver.Firefox(firefox_binary=binary)
return browser
if __name__ == "__main__":
browser = get_browser(binary=firefox_binary)
urls = (
('tor browser check', 'https://check.torproject.org/'),
('ip checker', 'http://icanhazip.com')
)
for url_name, url in urls:
print "getting", url_name, "at", url
browser.get(url)
В системе Ubuntu я смог запустить браузер Tor через селен. Эта машина работает на порту 9051 и приваси HTTP-прокси, который использует tor на порту 8118. Для того, чтобы браузер Tor передал страницу проверки tor, мне пришлось установить http-прокси для privoxy.
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
from selenium.webdriver.common.proxy import Proxy, ProxyType
from selenium import webdriver
browser = None
proxy_address = "127.0.0.1:8118"
proxy = Proxy({
'proxyType': ProxyType.MANUAL,
'httpProxy': proxy_address,
})
tor = '/usr/bin/tor-browser/Browser/firefox'
firefox_binary = FirefoxBinary(tor)
urls = (
('tor_browser_check', 'https://check.torproject.org/'),
('icanhazip', 'http://icanhazip.com'),
)
keys, _ = zip(*urls)
urls_map = dict(urls)
def get_browser(binary=None, proxy=None):
global browser
if not browser:
browser = webdriver.Firefox(firefox_binary=binary, proxy=proxy)
return browser
if __name__ == "__main__":
browser = get_browser(binary=firefox_binary, proxy=proxy)
for resource in keys:
browser.get(urls_map.get(resource))
Ответ 4
from selenium import webdriver
from selenium.webdriver.firefox.firefox_profile import FirefoxProfile
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
#path to TOR binary
binary = FirefoxBinary(r'...\Tor Browser\Browser\firefox.exe')
#path to TOR profile
profile = FirefoxProfile(r'...\Tor Browser\Browser\TorBrowser\Data\Browser\profile.default')
driver = webdriver.Firefox(firefox_profile= profile, firefox_binary= binary)
driver.get("http://icanhazip.com")
driver.save_screenshot("screenshot.png")
driver.quit()
Использование Python 3.5.1 в Windows 10
Ответ 5
Использование ruby,
profile = Selenium::WebDriver::Firefox::Profile.new
profile.proxy = Selenium::WebDriver::Proxy.new :socks => '127.0.0.1:9050' #port where TOR runs
browser = Watir::Browser.new :firefox, :profile => profile
Чтобы подтвердить, что вы используете Tor, используйте https://check.torproject.org/
Ответ 6
Я изучил это, и, если я не ошибаюсь, по номиналу это невозможно.
Причина этого не может быть вызвана тем, что:
- Tor Browser основан на коде Firefox.
- У браузера Tor есть определенные исправления для кода Firefox, чтобы предотвратить взаимодействие внешних приложений с Tor Browser (включая блокировку библиотеки Components.Interfaces).
- Selenium Firefox WebDriver взаимодействует с браузером через библиотеки Javascript, которые, как уже упоминалось, блокируются браузером Tor.
Это, по-видимому, так, что никто за пределами браузера Tor ни на вашем ящике, ни через интернет не знает о вашем просмотре.
Ваши альтернативы:
- Использовать прокси-сервер Tor через Firefox вместо Tor Browser (см. ссылку в комментариях к вопросу).
- Восстановите исходный код Firefox с помощью патчей Tor Browser, за исключением тех, которые предотвращают внешнюю связь с Tor Browser.
Я предлагаю первое.
Ответ 7
В качестве более новой альтернативы Selenium, которая управляет только Firefox, посмотрите Marionette. Чтобы использовать браузер Tor, включите марионетку при запуске через
Browser/firefox -marionette
(внутри расслоения). Затем вы можете подключиться через
from marionette import Marionette
client = Marionette('localhost', port=2828);
client.start_session()
и загрузите новую страницу, например, через
url='http://mozilla.org'
client.navigate(url);
Для получения дополнительных примеров существует учебник.
Более старый ответ
Проект Tor имеет селеновый тест для своего браузера. Он работает как:
from selenium import webdriver
ffbinary = webdriver.firefox.firefox_binary.FirefoxBinary(firefox_path=os.environ['TBB_BIN'])
ffprofile = webdriver.firefox.firefox_profile.FirefoxProfile(profile_directory=os.environ['TBB_PROFILE'])
self.driver = webdriver.Firefox(firefox_binary=ffbinary, firefox_profile=ffprofile)
self.driver.implicitly_wait(30)
self.base_url = "about:tor"
self.verificationErrors = []
self.accept_next_alert = True
self.driver.get("http://check.torproject.org/")
self.assertEqual("Congratulations. This browser is configured to use Tor.", driver.find_element_by_css_selector("h1.on").text)
Как вы видите, это использует переменные среды TBB_BIN
и TBB_PROFILE
для пакета и профиля браузера. Возможно, вы сможете жестко закодировать их в своем коде.