У меня есть вариант использования, когда мне нужно выполнить нечеткое сопоставление миллионов записей из нескольких файлов. Для этого я выделил два алгоритма: расстояние Яро-Винклер и Левенштейн.
Когда я начал изучать оба, я не мог понять, что такое точная разница между ними. Кажется, что Левенштейн дает количество исправлений между двумя строками, а Jaro-Winkler дает совпадение между 0.0 и 1.0. Я не понял алгоритм. Поскольку мне нужно использовать любой алгоритм, мне нужно знать точные различия в производительности алгоритма.