Подтвердить что ты не робот

Загрузка ошибки с помощью nltk.download()

Я экспериментирую с пакетом NLTK, используя Python. Я попытался загрузить NLTK с помощью nltk.download(). У меня такое сообщение об ошибке. Как решить эту проблему? Спасибо.

Используемая мной система - Ubuntu, установленная под VMware. IDE - Spyder.

enter image description here

После использования nltk.download('all') он может загружать некоторые пакеты, но при загрузке oanc_masc

появляется сообщение об ошибке,

enter image description here

4b9b3361

Ответ 1

Чтобы загрузить конкретный набор данных/моделей, используйте функцию nltk.download(), например. если вы хотите загрузить токенизатор предложения punkt, используйте:

$ python3
>>> import nltk
>>> nltk.download('punkt')

Если вы не знаете, какие данные/модель вам нужны, вы можете начать с основного списка данных + моделей с помощью:

>>> import nltk
>>> nltk.download('popular')

Он загрузит список "популярных" ресурсов.

Убедитесь, что у вас установлена ​​последняя версия NLTK, потому что она всегда улучшает и постоянно поддерживает:

$ pip install --upgrade nltk

EDITED

Если кто-то избегает ошибок при загрузке больших наборов данных из NLTK, из fooobar.com/questions/228305/...

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it already installed.
>>> dler.download('popular')

И если кто-то хочет найти каталог nltk_data, см. fooobar.com/questions/107598/...

И для config nltk_data путь, см. fooobar.com/questions/107595/...

Ответ 2

Из командной строки после импорта nltk попробуйте

nltk.download('popular', halt_on_error=False)

После ошибки он попросит повторить сломанный пакет, просто снижается с n, и он будет продолжать с правильными пакетами.