Подтвердить что ты не робот

Лучший алгоритм нечеткого соответствия?

Каков наилучший алгоритм нечеткого совпадения (Fuzzy Logic, N-Gram, Levenstein, Soundex....,) для обработки более 100000 записей за меньшее время?

4b9b3361

Ответ 1

Я предлагаю вам прочитать статьи Наварро, упомянутые в разделе "Рецензии" в статье Википедии под заголовком Приблизительное соответствие строк. Принятие вашего решения на основе фактических исследований всегда лучше, чем на предложениях случайных  незнакомцы.. Особенно, если вам важна работа над известным набором записей.

Ответ 2

Это зависит от ваших данных. Некоторые записи могут быть сопоставлены лучше других. Например, почтовый индекс является определенным форматом, поэтому его можно сравнивать по-другому с обычными строками. Люди могут быть сопоставлены по инициалам и DOB, или другим комбинациям и т.д.