Есть ли пакет, содержащий функцию подсчета расстояния Левенштейна, которая реализована как код C или Fortran? У меня есть много строк для сравнения, а stringMatch
от MiscPsycho
слишком медленно для этого.
Быстрое расстояние Левенштейна в R?
Ответ 1
levenshteinDist (из пакета RecordLinkage
) вызывает скомпилированный код C. Попробуйте.
Ответ 2
И stringdist
в пакете stringdist
делает это, даже быстрее, чем levenshteinDist
при определенных условиях (1)
Ответ 3
Вы также можете попробовать stringDist
из Biostrings