Подтвердить что ты не робот

Байесовская фильтрация для спама

Мне было интересно, есть ли хорошая и чистая реализация байесовской фильтрации для рассылки спама и текста? Это только для учебных целей.

4b9b3361

Ответ 1

Я определенно рекомендую Weka, который является программным обеспечением для разработки данных с открытым исходным кодом, написанным на Java:

Weka - это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.

Как упоминалось выше, он поставляется с множеством разных классификаторов, таких как SVM, Winnow, C4.5, Наивный Байес (конечно) и многие другие (см. API doc). Обратите внимание, что многие классификаторы, как известно, имеют гораздо лучшую производительность, чем Naive Bayes, в области обнаружения спама или классификации текста.

Кроме того, Weka приносит вам мощный мощный графический интерфейс...

Ответ 5

nBayes - еще одна реализация С#, размещенная на CodePlex