У меня есть куча имен, и я хочу получить уникальные имена. Однако из-за орфографических ошибок и несоответствий в данных имена могут быть записаны неправильно. Я ищу способ проверить вектор строк, если два из них подобны.
Например:
pres <- c(" Obama, B.","Bush, G.W.","Obama, B.H.","Clinton, W.J.")
Я хочу найти, что " Obama, B."
и "Obama, B.H."
очень похожи. Есть ли способ сделать это?