Я пытаюсь войти на сайт для некоторого выскабливания с использованием библиотеки Python и запросов, я пытаюсь выполнить следующее (что не работает):
import requests
headers = {'User-Agent': 'Mozilla/5.0'}
payload = {'username':'niceusername','password':'123456'}
In [12]: r = requests.post('https://admin.example.com/login.php',headers=headers,data=payload)
Но нада, получая перенаправление на страницу входа. Мне нужно открыть sesson? я делаю неправильный запрос POST, мне нужно загрузить куки? или сеанс делает это автоматически? я потерялся здесь, нужна помощь и объяснения.
Веб-сайт, на котором я пытаюсь войти, - это php, мне нужно "захватить set-cooki и установить заголовок cookie"? если так я понятия не имею, как это сделать. Веб-страница представляет собой форму со следующим (если это помогает): input: username '' password ' 'id': 'myform', 'action': "login.php
Дополнительная информация, может быть, вы можете увидеть, что мне здесь не хватает.
In [13]: r.headers
Out[13]: CaseInsensitiveDict({'content-encoding': 'gzip', 'transfer-encoding': 'chunked',
'set-cookie': 'PHPSESSID=v233mnt4malhed55lrpc5bp8o1; path=/',
'expires': 'Thu, 19 Nov 1981 08:52:00 GMT', 'vary': 'Accept-Encoding', 'server': 'nginx',
'connection': 'keep-alive', 'pragma': 'no-cache',
'cache-control': 'no-store, no-cache, must-revalidate, post-check=0, pre-check=0',
'date': 'Tue, 24 Dec 2013 10:50:44 GMT', 'content-type': 'text/html'})
In [14]: r.cookies
Out[14]: <<class 'requests.cookies.RequestsCookieJar'>[Cookie(version=0, name='PHPSESSID',
value='v233mnt4malhed55lrpc5bp8o1', port=None, port_specified=False, domain='admin.example.com',
domain_specified=False, domain_initial_dot=False, path='/', path_specified=True, secure=False,
expires=None, discard=True, comment=None, comment_url=None, rest={}, rfc2109=False)]>
Я очень благодарен за помощь, спасибо!
обновить, с ответом спасибо atupal:
import requests
headers = {'User-Agent': 'Mozilla/5.0'}
payload = {'username':'usr','pass':'123'}
link = 'https://admin.example.com/login.php'
session = requests.Session()
resp = session.get(link,headers=headers)
# did this for first to get the cookies from the page, stored them with next line:
cookies = requests.utils.cookiejar_from_dict(requests.utils.dict_from_cookiejar(session.cookies))
resp = session.post(link,headers=headers,data=payload,cookies =cookies)
#used firebug to check POST data, password, was actually 'pass', under 'net' in param.
#and to move forward from here after is:
session.get(link)