Я обрабатываю некоторые английские тексты в приложении Java, и мне нужно их остановить. Например, из текста "удобства/удобства" мне нужно получить "amenit".
Функция выглядит так:
String stemTerm(String term){
...
}
Я нашел анализатор Lucene, но он выглядит слишком сложным для того, что мне нужно. http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/analysis/PorterStemFilter.html
Есть ли способ использовать его, чтобы остановить слова без создания анализатора? Я не понимаю весь бизнес Analyzer...
РЕДАКТИРОВАТЬ: Мне действительно нужна сводная + лемматизация. Может ли Луценка сделать это?