Можете ли вы предложить небольшую библиотеку поиска нечеткого текста?
Что я хочу сделать, так это разрешить пользователям находить правильные данные для поисковых запросов с опечатками.
Я мог бы использовать полнотекстовые поисковые системы, такие как Lucene, но я думаю, что это перебор.
Edit:
Чтобы сделать более понятным вопрос, это основной сценарий для этой библиотеки:
У меня есть большой список строк. Я хочу, чтобы иметь возможность искать в этом списке (что-то вроде MSVS intellisense), но должно быть возможно отфильтровать этот список по строкам, который отсутствует в нем, но достаточно близко к некоторой строке, которая находится в списке.
Пример:
- Красный
- Green
- синий
Когда я печатаю "Gren" или "Geen" в текстовом поле, я хочу видеть "Green" в результирующем наборе.
Основным языком для индексированных данных будет английский.
Я думаю, что Луцену тяжело для этой задачи.
Обновление
Я нашел один продукт, соответствующий моим требованиям. Это ShuffleText.
Знаете ли вы какие-либо альтернативы?