Мне нужно сгруппировать некоторые текстовые документы и исследовать различные варианты. Похоже, что LingPipe может класть простой текст без предварительного преобразования (в векторное пространство и т.д.), Но это единственный инструмент, который я видел, который явно утверждает, что работает над строками.
Существуют ли какие-либо инструменты Python, которые могут непосредственно кластеризовать текст? Если нет, какой лучший способ справиться с этим?