Я имею дело с приложением, которое принимает ввод пользователя на разных языках (в настоящее время 3 фиксированных языка). Требование состоит в том, чтобы пользователи могли вводить текст и не беспокоиться, чтобы выбрать язык через предоставленный флажок в пользовательском интерфейсе.
Существует ли существующая библиотека Java для определения языка текста?
Мне нужно что-то вроде этого:
text = "To be or not to be thats the question."
// returns ISO 639 Alpha-2 code
language = detect(text);
print(language);
результат:
EN
Я не хочу знать, как самостоятельно создать детектор языка (я видел много блогов, пытающихся это сделать). Библиотека должна предоставить простой APi, а также работать полностью автономно. Открытое или коммерческое закрытие не имеет значения.
Я также нашел эти вопросы на SO (и еще несколько):