Я пытаюсь узнать, как помечать слова испанца с помощью NLTK.
Из nltk book, довольно просто пометить английские слова, используя их пример. Поскольку я новичок в nltk и всей обработке языка, я довольно запутался в том, как выполнять процедуру.
Я загрузил корпус cess_esp
. Есть ли способ указать корпус в nltk.pos_tag
. Я посмотрел документацию pos_tag
и не видел ничего, что могло бы предложить. Я чувствую, что мне не хватает некоторых ключевых концепций. Должен ли я вручную пометить слова в тексте снова в cess_esp corpus? (вручную я подразумеваю токенизацию моего отчёта и запуск его снова на корпус). Или я полностью не знаком. Спасибо вам