Можно ли загружать Treebank английских фраз бесплатно или менее $100? Мне нужны учебные данные, содержащие кучу синтаксических анализируемых предложений ( > 1000) на английском языке в любом формате. В основном все, что мне нужно, это просто слова в этих предложениях, которые распознаются частью речи.
Есть ли "Трибанк" бесплатно?
Ответ 1
NLTK (для Python) предлагает несколько древовидных бланков бесплатно.
Ответ 2
Вот несколько (англ.) древовидных брэндов:
-
American National Corpus: MASC
-
Вопросы: QuestionBank и исправления Стэнфорда
-
Британские новости: BNC
-
Обсуждение TED: NAIST-NTT TED Treebank
-
Многоязычный корпус Джорджтаунского университета: GUM
-
Biomedical:
См. также Wikipedia для огромного списка.
Ответ 3
как насчет Penn Treebank? Надеюсь, это будет бесплатно или по крайней мере. http://www.cis.upenn.edu/~treebank/cdrom2.html