Я использую pos_tagger для рецептов. Проблема, с которой я сталкиваюсь, заключается в том, что pos_tagger возвращает эти слова в императивном времени существительные, разве они не являются глаголами? Например:
При вводе:
combine 1 1/2 cups floud, 3/4 cup sugar, salt and baking powder
Вывод:
[('combine', 'NN'), ('1', 'CD'), ('1/2', 'CD'), ('cups', 'NNS'), ('floud', 'VBD'), (',', ','), ('3/4', 'CD'), ('cup', 'NN'), ('sugar', 'NN'), (',', ','), ('salt', 'NN'), ('and', 'CC'), ('baking', 'VBG'), ('powder', 'NN')]
Вот код, который я использую для этого:
def part_of_speech(self,input_sentance):
text = nltk.word_tokenize(input_sentance)
return nltk.pos_tag(text)
Не следует ли "комбинировать" помечать как своего рода глагол? Это вина nltk? Или я делаю что-то неправильно?