Я хочу создать веб-искатель, основанный на Scrapy, чтобы захватывать новости с нескольких сайтов новостного портала. Я хочу, чтобы этот искатель был:
-
Выполнить навсегда
означает, что периодические повторные посещения некоторых страниц портала будут получать обновления.
-
Расписание приоритетов.
Дайте разные приоритеты для разных типов URL-адресов.
-
Многопоточная выборка
Я прочитал документ Scrapy, но не нашел чего-то связанного с тем, что я перечислил (возможно, я недостаточно осторожен). Кто-нибудь знает, как это сделать? или просто дать некоторую идею/пример об этом. Спасибо!