Подтвердить что ты не робот

Интеграция Apache Nutch и Solr

Я попытался выполнить учебник по орехам, но с небольшим количеством проблем с файлом schema.xml.

Мне сказали, чтобы орех предоставил схему моему проекту, в основном это...

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/

Я развернул свой файл solr в Tomcat, и ошибка, которую я получаю, когда я перехожу на панель инструментов Solr,

collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text": 
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'

Что касается этого элемента в моем файле solrconfig.xml(я могу прокомментировать это, но не уверен, насколько это важно)

<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>

Я редактировал свой файл solrconfig.xml, чтобы попытаться включить ряд файлов jar, которые поставляются с solr, в частности

<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />

Но я не думаю, что они содержат отсутствующий класс "solr.EnglishPorterFilterFactory"

Есть ли у кого-нибудь идеи, почему это может не работать или я что-то пропустил? Я не разработчик Java, поэтому не сомневаюсь, что это будет что-то простое:)

UPDATE Узнав, что на схеме были ссылки на некоторые старые классы, я еще раз посмотрел в nutch/conf и tt, похоже, есть файл ${NUTCH_RUNTIME_HOME}/conf/schema-solr4.xml, который, похоже, работает.

Не 100%, если это правильно, но эй...

4b9b3361

Ответ 1

Похоже, EnglishPorterFilterFactory больше нет в 4.x. См. Примечание в это документация 3.6.0:

Deprecated.
  Use SnowballPorterFilterFactory with language="English" instead

Много устаревших вещей ушло в 4.0. Я бы сделал то, что он сказал, см. Документацию для SnowballPorterFilterFactory.