Я купил предложение, используя:
grammar = '''
NP:
{<DT>*(<NN.*>|<JJ.*>)*<NN.*>}
NVN:
{<NP><VB.*><NP>}
'''
chunker = nltk.chunk.RegexpParser(grammar)
tree = chunker.parse(tagged)
print tree
Результат выглядит так:
(S
(NVN
(NP The_Pigs/NNS)
are/VBP
(NP a/DT Bristol-based/JJ punk/NN rock/NN band/NN))
that/WDT
formed/VBN
in/IN
1977/CD
./.)
Но теперь я застреваю, пытаясь понять, как это сделать. Я хочу найти поддерево NVN и получить доступ к лексической фразе ( "The_Pigs" ), глаголу ( "есть" ) и правой части существительного ( "панк-рок-группа на основе Бристоля" ), Как это сделать?