Обнаруживать тайны английского глагола, используя NLTK

Я ищу способ, который дает английские фразы в виде графа текста в нем в прошлых, настоящих и будущих временах. На данный момент я использую NLTK, размещаю теги POS (Part-Of-Speech), а затем подсчитываю "VBD", чтобы пройти Времена. Это недостаточно точно, поэтому, я думаю, мне нужно пойти дальше и использовать chunking, а затем проанализировать VP-куски для конкретных временных шаблонов. Существует ли что-то существующее? Любое дальнейшее чтение, которое может быть полезно? книга NLTK сосредоточена в основном на NP-кусках, и я могу найти довольно мало информации о VP-кусках.

Ответ 1

Точный ответ зависит от того, какой chunker вы намереваетесь использовать, но понимание списков займет у вас долгий путь. Это дает вам количество глагольных фраз с использованием несуществующего chunker.

len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])

Вы можете использовать более тонкий подход для определения количества времен.

Ответ 2

Вы можете сделать это с помощью Berkeley Parser или Стэнфорд Parser. Но я не знаю, доступен ли интерфейс Python для.