Подтвердить что ты не робот

Urllib2 - отправить запрос

Я пытаюсь выполнить простой POST-запрос с urllib2. Однако ответ сервера указывает, что он получает простой GET. Я проверил тип исходящего запроса, но он установлен на POST.
Чтобы проверить, ведет ли сервер так, как я ожидаю, я попытался выполнить запрос GET с данными (бывшими POST-), связанными с URL-адресом. Это дало мне ответ, который я ожидал.
Кто-нибудь знает, что я неправильно понял?

def connect(self):
    url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    header = { 'User-Agent' : user_agent }

    values = {
      'city_from' : 69,
      'radius_from' : 0,
      'city_to' : 263,
      'radius_to' : 0,
      'date' : 'date',
      'day' : 5,
      'month' : 03,
      'year' : 2012,
      'tolerance' : 0
    }

    data = urllib.urlencode(values)
    # req = urllib2.Request(url+data, None, header) # GET works fine
    req = urllib2.Request(url, data, header)  # POST request doesn't not work

    self.response = urllib2.urlopen(req)

Кажется, это проблема, подобная той, что обсуждалась здесь: Python URLLib/URLLib2 POST, но я совершенно уверен, что в моем случае конечная косая черта отсутствует,;)

Я боюсь, что это может быть глупое заблуждение, но я уже давно думаю!



EDIT: удобная функция для печати:

def response_to_str(response):
    return response.read()

def dump_response_to_file(response):
    f = open('dump.html','w')
    f.write(response_to_str(response))



EDIT 2: Разрешение:

Я нашел инструмент для захвата реального взаимодействия с сайтом, http://fiddler2.com/fiddler2/. По-видимому, сервер берет данные из входной формы, перенаправляет несколько раз и затем делает запрос GET с этими данными, просто добавленными к URL-адресу. Все хорошо с urllib2, и я приношу свои извинения за неправильное использование вашего времени!

4b9b3361

Ответ 1

Просто, чтобы закрыть вопрос: "Проблема на самом деле была в том, что сервер не ожидал запросов POST (хотя он должен был рассматриваться как прецедент). Итак, (еще раз) структура не была нарушена.;)

Ответ 2

Вещи, которые необходимо проверить:

  • Вы уверены, что разместили правильный URL?
  • Вы уверены, что можете получать результаты без входа?
  • Покажите нам пример вывода для разных значений post.

Вы можете найти правильный URL-адрес, используя Firefox Firebug или Google Chromes DevTools.

Я предоставил вам код, который поддерживает файлы cookie, чтобы вы могли сначала войти в систему и использовать cookie для последующего запроса с вашими параметрами post.

Наконец, если вы можете показать нам пример вывода HTML, это облегчит жизнь.

Вот мой код, который до сих пор работал у меня достаточно надежно для POST-ing для большинства веб-страниц, включая страницы, защищенные CSRF/XSRF ( до тех пор, пока вы сможете правильно определить , что для публикации и , где (какой URL) для публикации).

import cookielib
import socket
import urllib
import urllib2

url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'
http_header = {
                "User-Agent" : "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.46 Safari/535.11",
                "Accept" : "text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,text/png,*/*;q=0.5",
                "Accept-Language" : "en-us,en;q=0.5",
                "Accept-Charset" : "ISO-8859-1",
                "Content-type": "application/x-www-form-urlencoded",
                "Host" : "www.mitfahrgelegenheit.de",
                "Referer" : "http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/"
                }

params = {
  'city_from' : 169,
  'radius_from' : 0,
  'city_to' : 263,
  'radius_to' : 0,
  'date' : 'date',
  'day' : 5,
  'month' : 03,
  'year' : 2012,
  'tolerance' : 0
}

# setup socket connection timeout
timeout = 15
socket.setdefaulttimeout(timeout)

# setup cookie handler
cookie_jar = cookielib.LWPCookieJar()
cookie = urllib2.HTTPCookieProcessor(cookie_jar)

# setup proxy handler, in case some-day you need to use a proxy server
proxy = {} # example: {"http" : "www.blah.com:8080"}

# create an urllib2 opener()
#opener = urllib2.build_opener(proxy, cookie) # with proxy
opener = urllib2.build_opener(cookie) # we are not going to use proxy now

# create your HTTP request
req = urllib2.Request(url, urllib.urlencode(params), http_header)

# submit your request
res = opener.open(req)
html = res.read()

# save retrieved HTML to file
open("tmp.html", "w").write(html)
print html

Ответ 3

Попробуйте добавить в свои заголовки пару:

   'Content-type': 'application/x-www-form-urlencoded'

Ответ 4

Попробуйте удалить конечную косую черту с вашего URL следующим образом:

url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html'

Может случиться, что сервер script, который вы отправляете POST, отправляется, фактически не поддерживает запросы POST.