Я пытаюсь создать специализированный веб-сайт поисковой системы, который индексирует ограниченное количество веб-сайтов. Решение, которое я придумал, это:
- используя Nutch в качестве веб-искателя,
- используя Solr в качестве поисковой системы,
- интерфейсный код и логика сайта закодированы с помощью Wicket.
Проблема в том, что я считаю, что Nutch достаточно сложный, и это большая часть программного обеспечения для настройки, несмотря на то, что детальная документация (книги, последние учебники и т.д.) просто не существует.
Теперь вопросы:
- Любая конструктивная критика о дырочной идее сайта?
- Есть ли еще одна простая альтернатива Nutch (как обходная часть сайта)?
Спасибо