Кто-нибудь знает самый простой способ извлечь только существительные из текста?
Я слышал о инструменте TreeTagger, и я попытался дать ему шанс, но не смог заставить его работать по какой-то причине.
Любые предложения?
Спасибо Phil
EDIT:
import org.annolab.tt4j.*; TreeTaggerWrapper tt = new TreeTaggerWrapper(); try { tt.setModel("/Nouns/english.par"); tt.setHandler(new TokenHandler() { void token(String token, String pos, String lemma) { System.out.println(token+"\t"+pos+"\t"+lemma); } }); tt.process(words); // words = list of words } finally { tt.destroy(); }
Это мой код, английский - это язык. Я получаю сообщение об ошибке: Тип new TokenHandler() {} должен реализовать унаследованный абстрактный метод TokenHandler.token. Я что-то делаю неправильно?