Я просмотрел ряд других сообщений здесь и в другом месте (см. ниже), но у меня все еще нет четкого ответа на этот вопрос: как windows wchar_t обрабатывает символы Unicode вне базовой многоязычной плоскости?
То есть:
- многие программисты чувствуют, что UTF-16 вреден, потому что это код переменной длины.
- wchar_t имеет ширину 16 бит в окнах, но 32-битный бит в Unix/MacOS
- В API Windows используются широкоформатные символы, а не Юникод.
Итак, что делает Windows, когда вы хотите кодировать что-то вроде 𠂊 (U + 2008A) Han Character в Windows?