Мне было интересно, как узнать, сколько байтов имеет символ?
Как узнать, сколько байтов имеет символ?
Ответ 1
Если вы хотите узнать, сколько байтов UTF-8 имеет букву в строке PHP, то:
print strlen(mb_substr($string, 0, 1, "utf-8"));
strlen()
возвращает длину необработанного байта, а mb_substr()
возвращает символ в соответствии с кодировкой/кодировкой. В этом примере из позиции 0
.
Ответ 2
- ASCII - 7 бит.
- В большинстве других языков используется 8 бит (1 байт).
- Многие восточные языки (китайский, японский) используют 16 бит (2 байта).
- Unicode обычно составляет 32 бита (4 байта).
Как хранится и отображается символ зависит от языка программирования и используемой вами платформы.