У меня есть тонна коротких рассказов длиной около 500 слов, и я хочу классифицировать их в одну из, допустим, 20 категорий:
- Развлечения
- Еда
- Музыка
- и т.д.
Я могу вручную классифицировать их, но я хочу реализовать машинное обучение, чтобы угадать категории в конечном итоге. Какой лучший способ приблизиться к этому? Существует ли стандартный подход к компьютерному обучению, который я должен использовать? Я не думаю, что дерево решений будет работать хорошо, так как это текстовые данные... Я совершенно новый в этой области.
Любая помощь будет оценена, спасибо!