Я пытаюсь извлечь из предложения триплетный предмет, предикат и объект. Мне нужно больше ссылок на то, как это сделать.
Извлечь предмет триплета, предикат и предложение объекта
Ответ 1
Самый простой способ сделать это, с приемлемым результатом - сделать мелкий синтаксический анализ, а затем извлечь NOUN-VERB-NOUN троек. Это должно работать на всех языках SVO (subject-verb-object), таких как английский. Некоторая настройка может потребоваться для извлечения только первой тройки из предложения или не извлечения в случае комы. Это очень быстрое решение, поскольку мелкая маркировка POS обычно равна O (n) - 0,01 за предложение, вместо глубокого анализа (Open NLP, Stanford Parser), который равен O (n ^ 3) - 0,4 с за предложение.
Ответ 2
вы можете использовать API-анализатор Stanford или Открыть NLP сделать часть речевых меток и некоторых других операций NLP
и для триплетной экстракции вы можете реализовать одну из методик в документах, доступных в Интернете, я знаю хороший вариант: http://ailab.ijs.si/delia_rusu/Papers/is_2007.pdf
Ответ 3
Я работаю над подобной проблемой, я работаю в Visual Basic. Во-первых: у меня есть список тем /NOUNS Во-вторых: когда я извлекаю предикат, я извлекаю между фразой...
(кошка) (Sat on) (Коврик)
создавая список Subject с существительными и существительными фразами, их позиции могут быть заменены (шаблон обучения) то, если испытуемые не обнаружены, ранее обнаруженный предикат мог быть обнаружен.
Возможно, это похоже на алгоритм снежного кома.