Я предполагаю, что могу взять текст и удалить из него высокочастотные английские слова. По ключевым словам, я имею в виду, что я хочу извлечь слова, которые наиболее характерны для содержания текста (тегов). Он не должен быть идеальным, хорошее приближение идеально подходит для моих нужд.
Кто-нибудь сделал что-нибудь подобное? Вы знаете библиотеку Perl или Python, которая это делает?
Lingua:: EN:: Tagger - это именно то, что я задал, но мне нужна библиотека, которая также могла бы работать и для французского текста.