Я хочу знать, есть ли API для текстового анализа в Java. Что-то, что может извлечь все слова в тексте, отдельные слова, выражения и т.д. Что-то, что может сообщить, если найденное слово - это число, дата, год, имя, валюта и т.д.
Теперь я начинаю анализ текста, поэтому мне нужен только API для запуска. Я сделал веб-искатель, теперь мне нужно что-то проанализировать загруженные данные. Нужны методы для подсчета количества слов на странице, похожих слов, типа данных и других ресурсов, связанных с текстом.
Существуют ли API для текстового анализа в Java?
EDIT: Text-mining, я хочу обработать текст. API для Java, который предоставляет это.