Существуют стандартные символы A-Z, a-z, но также есть дефисы, em-тире, кавычки и т.д.
Кроме того, есть все международные символы, такие как умлауты и т.д.
Итак, для английской системы, какой комплект? Что относительно наборов для других языков? Что относительно UTF8, UTF16 и т.д.?
Бонусный вопрос: сколько полей имени необходимо и каковы их максимальные длины?
РЕДАКТИРОВАТЬ: В именах людей определенно два разных типа персонажей, те, которые присутствуют как часть контекста, и те, которые существуют по структурным причинам. Я не хочу ограничивать или вмешиваться в контекстные символы, но мне нужно иметь дело со структурными.
Например, у меня появилось имя, разделенное символом em, но было трудно отличить его от минус-символа. Чтобы сделать систему более удобной для поиска, я хочу взять все пять различных типов тире и сопоставить их с одним уникальным символом (минус), таким образом поисковик не должен знать конкретно, какой символ был первоначально введен.
Проблема существует для тире, возможно, кавычки, но также и сколько других символов?