Подтвердить что ты не робот

Учебники для обработки естественного языка

Недавно я посетил класс coursera о "обработке естественного языка", и я много узнал о разборе, IR и других интересных аспектах например Q & A и т.д., хотя я хорошо разбирался в концепциях, но на самом деле я практически не знал об этом. Может ли кто-нибудь предложить мне хорошие онлайн-учебники или книги для обработки естественного языка?

Спасибо

4b9b3361

Ответ 1

Вы можете прочитать Jurafsky и Martin Речь и обработка языка (издание 2008 г.), который является стандартным учебником в этой области. Это долго и имеет множество тем, поэтому я бы предложил прочитать только главы, которые действительно применимы к вашим интересам.

Кроме того, лучший способ узнать - это почти наверняка на самом деле реализовать алгоритмы НЛП с нуля. Вы могли бы выбрать некоторые стандартные задачи (языковое моделирование, классификация текста, маркировку POS, NER, синтаксический анализ) и реализовать различные алгоритмы с нуля (модели ngram, HMM, Naive Bayes, MaxEnt, CKY), чтобы действительно понять, что заставляет их работать. Также не должно быть слишком сложно найти какой-либо бесплатный набор данных для тестирования ваших реализаций.

Наконец, есть много учебников для конкретных алгоритмов НЛП, которые превосходны. Например, если вы хотите создать HMM, я предлагаю учебник Jason Eisner, который также охватывает сглаживание и неконтролируемое обучение с помощью EM. Если вы хотите внедрить выборку Gibbs для неконтролируемого обучения Naive Bayes, я предлагаю учебник Philip Resnik.

Ответ 2

Помимо книги Юрафского и Мартина, Кристофер Д. Мэннинг и Хинрих Шютце Основы статистической обработки естественного языка также широко используются. Для IR Manning et al. также написал Введение в информационный поиск, который можно прочитать или скачать онлайн на своем сайте.

Ответ 3

Если вам нужны практические знания о том, как вы можете работать на естественном языке, вы должны начать его реализацию. Я предлагаю использовать NLTK (набор инструментов для создания естественного языка) с Python. Его легко реализовать NLP в python.

Вы можете ссылаться на эту ссылку http://nltk.org/

Или вы можете попробовать его онлайн http://cst.dk/online/pos_tagger/uk/

Ответ 4

Вместо того, чтобы читать определенную книгу, погружение в море бумаг может быть хорошей идеей. http://www.aclweb.org, например, содержит много тем в НЛП. Через эти документы вы получаете ссылки на другие документы, некоторые из которых являются основами определенной отрасли НЛП. И поскольку они были написаны разными авторами, вы вряд ли сильно повлияете на одну точку зрения.

Ответ 5

Если вы разработчик Java, существует обширный список учебников по созданию компонентов систем НЛП с использованием LingPipe по адресу http://alias-i.com/lingpipe/demos/tutorial/read-me.html. Полное раскрытие Я написал некоторые из этих учебников и одну из приведенных ниже книг.

Есть несколько книг, которые более ориентированы на индустрию:

1) Обработка естественного языка с помощью Java Ричардом М Риз

Здесь описывается, как выполнять некоторые общие задачи с помощью набора инструментов с открытым исходным кодом (включая LingPipe).

2) Обработка естественного языка с помощью Java и LingPipe Cookbook Paperback Брек Болдуин, Кришна Даянидхи

Эта книга задана на уровне "получить компонент, построенный" и охватывает основные технологии, управляющие большинством НЛП-систем, которые основаны на тексте. Он не охватывает перевод. Это более подробно, чем первая книга, и имеет более широкий охват, чем учебники LingPipe, но иногда менее детализирован, чем учебники.

Брек

Ответ 6

Существует учебный центр для учебных и учебных материалов, называемый TeLeMaCo. Вы можете найти ресурсы для многих аспектов НЛП, и вы можете легко добавить больше материалов, которые вы нашли в Интернете.