Начальные ресурсы/введение в алгоритмы классификации

все. Я совершенно новичок в теме классификационных алгоритмов и нуждаюсь в нескольких хороших указателях о том, где начать "серьезное чтение". Я сейчас в процессе выяснения, может ли машинное обучение и автоматические алгоритмы классификации быть полезной для добавления к моему применению.

Я уже просмотрел "Как решить его: современная эвристика" З. Михалевича и Д. Фогеля (в частности, главы о линейных классификаторах с использованием нейронных сетей), и с практической стороны я просматриваю в настоящее время исходный код инструмента WEKA. Следующим (запланированным) шагом было бы погружение в область байесовских алгоритмов классификации.

К сожалению, мне не хватает серьезной теоретической основы в этой области (не говоря уже об использовании ее каким-либо образом до сих пор), поэтому любые намеки на то, где смотреть дальше, будут оценены; в частности, было бы полезно хорошее введение доступных алгоритмов классификации. Будучи более ремесленником и менее теоретиком, чем практичнее, тем лучше...

Подсказки, кто-нибудь?

Ответ 1

Я всегда находил Учебники Эндрю Мура, чтобы быть очень полезным. Они основаны на твердой статистической теории и будут очень полезны в понимании бумаг, если вы захотите их прочитать в будущем. Вот краткое описание:

К ним относятся классификация алгоритмы, такие как деревья решений, нейронные сети, байесовские классификаторы, Поддержка векторных машин и основанный на корпусе (он же непараметрический) обучение. Они включают регрессию алгоритмы, такие как многомерные полиномиальная регрессия, MARS, локально Взвешенная регрессия, ГМДГ и нейронная Сетки. И они включают другие данные горные работы, такие как кластеризация (модели смеси, k-средства и иерархические), байесовские сети и Укрепление обучения

Ответ 2

Ответ относящийся к учебникам Andrew Moore, является хорошим. Однако я хотел бы увеличить его, предложив некоторые чтения о необходимости, которая в первую очередь стимулирует создание многих систем классификации: идентификация причинно-следственных связей. Это имеет отношение ко многим проблемам моделирования, связанным с статистическим выводом.

Лучший ресурс, который я знаю для изучения систем причинности и классификаторов (особенно байесовских классификаторов), Книга Иудеи Перл "Причинность: модели, рассуждения и умозаключение" .

Ответ 3

Обзор машинного обучения

Чтобы получить хороший обзор поля, просмотрите видео-лекции курс обучения Andrew Ng Machine.

Этот курс (CS229) - преподаваемый профессором Эндрю Нг - обеспечивает широкое введение в машинное обучение и распознавание статистических моделей. Темы включают контролируемое обучение, неконтролируемое обучение, теорию обучения, обучение подкреплению и адаптивный контроль. Также обсуждаются последние приложения машинного обучения, такие как роботизированный контроль, интеллектуальный анализ данных, автономная навигация, биоинформатика, распознавание речи и обработка текстовых и веб-данных.

Классификаторы

Что касается того классификатора, который вы должны использовать, я бы рекомендовал сначала начать с Поддержка векторных машин (SVM) для общих прикладных задач классификации. Они дадут вам самую современную производительность, и вам не нужно понимать всю теорию, лежащую в их основе, чтобы просто использовать реализацию, предоставляемую пакетом типа WEKA.

Если у вас есть больший набор данных, вы можете попробовать использовать Random Forests. Там также реализация этого алгоритма в WEKA, и они тренируют гораздо быстрее на больших данных. Хотя они менее широко используются, чем SVM, их точность, как правило, соответствует или почти соответствует точности, которую вы можете получить от одного.