urllib.urlretrieve
возвращает молча, даже если файл не существует на удаленном http-сервере, он просто сохраняет html-страницу в указанном файле. Например:
urllib.urlretrieve('http://google.com/abc.jpg', 'abc.jpg')
просто возвращается молча, даже если abc.jpg не существует на сервере google.com, сгенерированный abc.jpg
не является допустимым файлом jpg, он фактически является html-страницей. Я думаю, что возвращенные заголовки (экземпляр httplib.HTTPMessage) могут использоваться для фактического определения того, успешны ли результаты поиска или нет, но я не могу найти какой-либо документ для httplib.HTTPMessage
.
Может ли кто-нибудь предоставить некоторую информацию об этой проблеме?