Я пытаюсь найти код, который действительно работает, чтобы найти наиболее часто используемые две и три словосочетания в R text mining package (возможно, для него есть другой пакет, который я не знаю). Я пытаюсь использовать токенизатор, но, похоже, не повезло.
Если вы работали над подобной ситуацией в прошлом, можете ли вы опубликовать код, который протестирован и действительно работает? Большое вам спасибо!