Я экспериментирую с скрытым распределением Дирихле для обсуждения и назначения темы, и я ищу совет.
- Какая программа является "лучшей", где лучше всего сочетается самая простая в использовании, лучшая предварительная оценка, быстрая
- Как включить свои интуиции в актуальность. Скажем, я думаю, что знаю, что некоторые предметы в корпусе действительно в той же категории, как и все статьи того же автора. Могу ли я добавить это в анализ?
- Любые неожиданные подводные камни или подсказки, которые я должен знать, прежде чем приступать к работе?
Я бы предпочел, что для любой программы есть R или Python, но я ожидаю (и принимаю), что буду иметь дело с C.