Я использую классификатор Naive Bayes для классификации нескольких тысяч документов в 30 разных категориях. Я реализовал классификатор Naive Bayes, и с некоторым выбором функций (в основном, фильтрацией бесполезных слов), я получил около 30% точности теста с 45% точностью обучения. Это значительно лучше, чем случайный, но я хочу, чтобы это было лучше.
Я попытался внедрить AdaBoost с NB, но, похоже, он не дает значительно лучших результатов (литература, похоже, разделена на это, некоторые бумаги говорят, что AdaBoost с NB не дает лучших результатов, другие делают). Знаете ли вы о каких-либо других расширениях NB, которые могут дать лучшую точность?
Большое спасибо.