Мои пользователи будут импортировать через вырез и вставить большую строку, которая будет содержать названия компаний.
У меня есть существующая и растущая база данных MYSQL имен компаний, каждая из которых имеет уникальный company_id.
Я хочу иметь возможность анализировать строку и назначать каждому имени пользователя, введенного пользователем, нечеткое соответствие.
Прямо сейчас, просто выполняя прямолинейное совпадение строк, тоже медленно. ** Будет ли индексирование Soundex быстрее? Как я могу дать пользователю некоторые параметры при вводе? **
Например, кто-то пишет:
Microsoft -> Microsoft Bare Essentials -> Bare Escentuals Polycom, Inc. -> Polycom
Я нашел следующие темы, похожие на этот вопрос, но плакат не одобрен, и я не уверен, применим ли их прецедент:
Как найти лучшее нечеткое соответствие для строки в большой строковой базе данных