Я пытаюсь написать script для проверки наличия веб-страницы, было бы неплохо, если бы он проверял, не загружая всю страницу.
Это моя прыгающая точка, я видел, что несколько примеров используют httplib одинаково, однако каждый проверенный мной сайт просто возвращает false.
import httplib
from httplib import HTTP
from urlparse import urlparse
def checkUrl(url):
p = urlparse(url)
h = HTTP(p[1])
h.putrequest('HEAD', p[2])
h.endheaders()
return h.getreply()[0] == httplib.OK
if __name__=="__main__":
print checkUrl("http://www.stackoverflow.com") # True
print checkUrl("http://stackoverflow.com/notarealpage.html") # False
Любые идеи?
Изменить
Кто-то предложил это, но их сообщение было удалено.. Неужели urllib2 не загружает всю страницу?
import urllib2
try:
urllib2.urlopen(some_url)
return True
except urllib2.URLError:
return False