Я пытаюсь реализовать наивный байесовский подход, чтобы найти тему данного документа или потока слов. Есть ли наивный байесовский подход, который я мог бы найти для этого?
Кроме того, я пытаюсь улучшить словарь, поскольку я иду. Первоначально у меня есть куча слов, которые отображаются на темы (жестко закодированные). В зависимости от появления слов, отличных от тех, которые уже сопоставлены. И в зависимости от появления этих слов я хочу добавить их в сопоставления, следовательно, улучшая и узнавая о новых словах, которые относятся к теме. А также изменение вероятностей слов.
Как я должен это делать? Является ли мой подход правильным?
Какой язык программирования лучше всего подходит для реализации?