Мне было интересно, есть ли хорошая и чистая реализация байесовской фильтрации для рассылки спама и текста? Это только для учебных целей.
Байесовская фильтрация для спама
Ответ 1
Я определенно рекомендую Weka, который является программным обеспечением для разработки данных с открытым исходным кодом, написанным на Java:
Weka - это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.
Как упоминалось выше, он поставляется с множеством разных классификаторов, таких как SVM, Winnow, C4.5, Наивный Байес (конечно) и многие другие (см. API doc). Обратите внимание, что многие классификаторы, как известно, имеют гораздо лучшую производительность, чем Naive Bayes, в области обнаружения спама или классификации текста.
Кроме того, Weka приносит вам мощный мощный графический интерфейс...
Ответ 2
Ознакомьтесь с главой 6 Программирование коллективного интеллекта
Ответ 3
Возможно https://ci-bayes.dev.java.net/ или http://www.cs.cmu.edu/~javabayes/Home/node2.html?
Я никогда не играл с этим.
Ответ 4
Вот реализация байесовской фильтрации в С#: Наивный байесовский спам-фильтр для С# (размещен на CodeProject).
Ответ 5
nBayes - еще одна реализация С#, размещенная на CodePlex
Ответ 6
По-французски, но вы сможете найти ссылку для скачивания:) PHP Наивный байесовский фильтр