Подтвердить что ты не робот

Библиотеки анализа текста Java

Я ищу решение, основанное на Java, на требование анализа предложений для регистрации того, использовалось ли ключевое слово положительно или отрицательно.

Т.е. ключевым словом может быть "капуста" и предложение: -

"Мне нравится капуста, но не горох"

И я бы хотел, чтобы текстовый анализатор java каким-то образом записывал это как положительное. Могут ли библиотеки lucene (Hibernate-Search) использоваться для этого?

Любые мысли?

4b9b3361

Ответ 2

Я сомневаюсь, что что-то в этом роде. Lucene определенно не может сделать это из коробки.

Как вы даже определяете, было ли ключевое слово применено положительно или отрицательно, таким образом, чтобы его можно было программно оценить? Чтобы сделать это правильно, вам придется проанализировать текст для их фактического значения, что является проблемой ИИ, которая даже не разрешена удаленно.

Я полагаю, вы могли бы решить это примерно путем простого статистического анализа того, будет ли ключевое слово чаще встречаться с положительными (например, хорошими, замечательными, замечательными) или негативными (плохими, ненавистными, дерьмовыми, проклятыми) ключевыми словами, но даже там, отрицания, сарказм и сложные структуры предложений будут проблематичными.

Ответ 3

Взгляните на Mahout Taste, который основывается на Lucene, но добавляет много того, что вам нужно из коробки. (изменить) Я должен добавить, Mahout Taste просто связан с тем, что вы ищете, а не со 100% -й совпадением.