Я хочу использовать scrapy для обхода веб-страниц. Есть ли способ передать стартовый URL из самого терминала?
В документации указывается, что либо имя паука, либо URL-адрес можно указать, но когда я даю URL-адрес, он бросает ошибка:
//Я называю мой паук примером, но вместо имени моего паук я указываю url (он отлично работает, если я даю имя паука).
scraw crawl example.com
ERROR:
Файл "/usr/local/lib/python2.7/dist-packages/Scrapy-0.14.1-py2.7.egg/scrapy/spidermanager.py", строка 43, в создании raise KeyError ( "Паук не найден:% s" % spider_name) KeyError: "Паук не найден: example.com"
Как я могу сделать scrapy для использования моего паука на URL-адресе, указанном в терминале?