В настоящее время я преподаю курс естественного языка в своем университете и все еще смущен некоторой базовой концепцией. Я получил определение POS Tagging из Основы статистической обработки естественного языка:
Маркировка - это задача маркировки (или пометки) каждого слова в предложении с соответствующей частью речи. Мы решаем, является ли каждое слово существительное, глагол, прилагательное и т.д.
Но я не могу найти определение Shallow Parsing в книге, так как он также описывает мелкий синтаксический анализ как одну из утилит POS Tagging. Поэтому я начал искать в Интернете и не нашел прямого объяснения мелкого разбора, но в Wikipedia:
Малый синтаксический анализ (также chunking, "light parsing" ) - это анализ предложения, который идентифицирует составляющие (группы существительных, глаголы, группы глаголов и т.д.), но не указывает их внутреннюю структуру, а также их роль в основное предложение.
Я откровенно не вижу разницы, но это может быть из-за моего английского или просто не понимающего простой базовой концепции. Может ли кто-нибудь объяснить разницу между мелким разбором и маркировкой POS? Неглубокий синтаксический анализ часто также называется неглубоким семантическим анализом?
Спасибо раньше.