Подтвердить что ты не робот

Учебники WEKA/Примеры для новичков

В продолжение этого ответа я хочу спросить, знает ли кто-нибудь из вас хорошие (и, что более важно, простые для понимания) учебники и/или примеры интеллектуального анализа данных с помощью инструментария Weka.

Я очень интересовался Data Mining с тех пор, как впервые услышал о ней и о том, что она может сделать, у меня также есть несколько экспериментов, которые я хотел бы провести с некоторыми из моих данных, и я уже купил четыре книги и я нашел особенно интересными следующие две:

Intelligent Data Analysis Data Mining http://ecx.images-amazon.com/images/I/61DhYb1Z6QL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg

Последний написан теми же авторами Weka и содержит много примеров, но все же мне было немного трудно понять логику и особенно математику. Мои математические навыки в настоящее время очень грубые, я планирую поступить в университет в этом году, и, надеюсь, я буду учиться и лучше понимать математические вопросы, но до тех пор я хочу немного попрактиковаться в Data Mining.

Есть ли пошаговое руководство с примерами данных, которые я могу прочитать, чтобы начать работать с инструментарием Weka?

4b9b3361

Ответ 1

Когда дело доходит до "прикладного" интеллектуального анализа данных, для начинающих вам может вообще не нужно думать о математике. Weka - продукт университетского проекта машинного обучения и предлагает более 100 алгоритмов. Сравните это с Microsoft SQL Server SSAS, который предлагает девять алгоритмов, и они даже не удосуживаются объяснить математику.

Оба они предлагают ассоциацию, кластеризацию, выбор атрибутов, какую-то нейронную сеть. Итак, трюк заключается в том, чтобы понять, чего вы пытаетесь достичь, а не обязательно ниже. Попробуйте прочитать о алгоритмах Microsoft (хорошая документация) и посмотрите, можете ли вы понять принципы, которые имеют SSAS и Weka, - это должно помочь вам сосредоточиться на основных принципах и начать работу.

Ниже приведен список нескольких инструкций Weka .

Ответ 2

Лично я бы использовал RapidMiner5, так как это супер-простая графическая среда (намного лучше, чем v4). Он имеет все доступные функции WEKA.

Получить quickminer здесь: http://www.rapid-i.com

Super easy intro видео для RapidMiner здесь:

https://dspace.ndlr.ie/jspui/handle/10633/2353

здесь:

http://www.neuralmarkettrends.com/

и здесь:

http://www.youtube.com/user/VancouverData

Если вы хотите узнать больше о статистике, связанной с интеллектуальным анализом данных, см. эту лекцию в серии Standford в Google:

http://www.youtube.com/watch?v=zRsMEl6PHhM&feature=related