Допустим, что у меня есть символы Ú, Ù, Ü. Все они похожи глифически на английский язык.
Есть ли список или алгоритм для этого:
- Учитывая, что Ú или Ù или Ü верните английский язык U
- Учитывая английский U, верните список всех U-подобных символов
Я не уверен, что кодовая точка символов Unicode одинакова для всех шрифтов? Если это так, я полагаю, что для этого может быть какой-то простой способ и эффективность?
UPDATE
Если вы используете Ruby, в этом случае есть драгоценный камень unicode-confusable, который может помочь в некоторых случаях.