Сколько битов или байтов существует на "символ"?
Сколько битов или байтов в символе?
Ответ 1
Это зависит от характера и того, в каком кодировании он находится:
-
Символ ASCII в 8-разрядной кодировке ASCII составляет 8 бит (1 байт), хотя он может поместиться в 7 бит.
-
Символ ISO-8895-1 в кодировке ISO-8859-1 составляет 8 бит (1 байт).
-
Символ Unicode в кодировке UTF-8 находится между 8 битами (1 байт) и 32 битами (4 байта).
-
Символ Юникода в кодировке UTF-16 находится между 16 (2 байтами) и 32 битами (4 байта), хотя большинство общих символов принимают 16 бит. Это кодировка, используемая Windows внутренне.
-
Символ Unicode в кодировке UTF-32 всегда 32 бита (4 байта).
-
Символ ASCII в UTF-8 - 8 бит (1 байт), а в UTF-16 - 16 бит.
-
Дополнительные символы (не ASCII) в ISO-8895-1 (0xA0-0xFF) будут принимать 16 бит в UTF-8 и UTF-16.
Это означало бы, что между 0.03125 и 0.125 символами.
Ответ 2
В байте 8 бит (обычно в Windows).
Однако, если вы имеете дело с символами, это будет зависеть от кодировки/кодировки. Символ Unicode может быть 2 или 4 байта, поэтому это будет 16 или 32 бита, тогда как Windows-1252, иногда неправильно называемый ANSI, составляет всего 1 байт, поэтому 8 бит.
В азиатской версии Windows и некоторых других система работает в двухбайтовом формате, поэтому символ имеет 16 бит.
EDITED
В комментарии Matteo все современные версии Windows используют 16 бит для каждого символа.