Подтвердить что ты не робот

Ситуации, которые предпочитают Apache Lucene над Solr?

Существует несколько преимуществ использования Solr 1.4 (факсимильный поиск, группировка, репликация, http-администрирование и luke,...).

Даже если я внедряю функцию поиска в своем приложении Java, я мог бы использовать SolrJ, чтобы избежать компрометации HTTP при использовании Solr. Рекомендуется ли SolrJ вообще?

Итак, когда бы вы порекомендовали использовать "pure-Lucene"? Имеет ли он лучшую производительность или требует меньше оперативной памяти? Является ли это более надежным для тестирования?

PS: Я знаю этот вопрос.

4b9b3361

Ответ 1

Если у вас есть веб-приложение, используйте Solr - я пробовал интегрировать оба, и Solr проще. В противном случае, если вам не нужны функции Solr (тот, который приходит на ум как наиболее важный, - это фасетный поиск), затем используйте Lucene.

Ответ 2

Если вы хотите полностью внедрить свои функции поиска в свое приложение и не хотите поддерживать отдельный процесс, например Solr, использование Lucene, вероятно, предпочтительнее. Например, настольному приложению может потребоваться некоторая функция поиска (например, Eclipse IDE, которая использует Lucene для поиска своей документации). Вероятно, вы не хотите, чтобы такое приложение запускало тяжелый процесс, например Solr.

Ответ 3

Вот одна из ситуаций, когда я должен использовать Lucene.

Учитывая набор документов, найдите наиболее распространенные термины в них.

Здесь мне нужно получить доступ к векторам сроков каждого документа (используя низкоуровневые API-интерфейсы TermVectorMapper). С Lucene это довольно легко.

Другой вариант использования - очень специализированное упорядочение результатов поиска. Для exmaple я хочу найти имя автора (который написал несколько книг), чтобы привести к одной книге из каждого магазина в первых 10 результатах. В этом случае я найду результаты из каждого книжного магазина и покажу окончательные результаты. Я выберу один результат из каждого книжного магазина. Здесь вы, по сути дела, выполняете несколько запросов для получения конечных результатов. Доступ к низкоуровневым API lucene определенно помогает.

Еще одна причина для Луценки - получить новые лакомства как можно скорее. Это уже не так, поскольку оба они были объединены, и будут синхронные релизы.

Ответ 4

Я удивлен, что никто не упоминает NRT - поиск в режиме реального времени, доступный с Lucene, но не с Solr (пока).

Ответ 5

Используйте Solr, если вы больше заботитесь о масштабируемости, чем о производительности, и используете Lucene, если вас больше беспокоит производительность, чем масштабируемость.