Я использую scrapy для сканирования нескольких страниц на сайте.
Переменная start_urls
используется для определения страниц, подлежащих обходу.
Сначала я начинал с 1-й страницы, определяя start_urls = [1st page]
в файле example_spider.py
Получив больше информации с 1-й страницы, я бы определил, какие страницы будут сканироваться, а затем назначит start_urls
соответственно. Следовательно, я должен перезаписать выше example_spider.py с изменениями в start_urls = [1st page, 2nd page, ..., Kth page]
, а затем снова запустить обход scrapy.
Это лучший подход или есть лучший способ динамически назначать start_urls
с помощью scrapy API без перезаписывания example_splider.py
?
Спасибо.