Подтвердить что ты не робот

Сколько символов можно сохранить в 4 КБ?

Сколько символов можно хранить в 4kb, когда символы находятся в кодировке utf-8?

4b9b3361

Ответ 1

В символах UTF-8 требуется от 1 до 4 байтов. Таким образом, вы можете хранить от 4096 до 1024 символов UTF-8 в 4 КБ.

Я бы предположил, что во многих случаях использования вы можете ожидать, что большинство символов вписываются в один байт и почти все в 2.

Ответ 2

Вот визуальная подсказка, насколько 1024 или 4096. Прочтите сообщение @Jon Snyder, чтобы получить лучшее понимание.

1024 символов (предположим, что символы имеют 4 байта):

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean como ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla, следовательно, massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. В enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Энеанский вульгатный цветок. Aenean leo ligula, porttitor eu, следовательно, биография, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Энеанский непорядок. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit ve

4096 символов (предположим, что символы имеют 1 байт):

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean como ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla, следовательно, massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. В enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Энеанский вульгатный цветок. Aenean leo ligula, porttitor eu, следовательно, биография, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Энеанский непорядок. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris сидит amet нибх. Donec sodales sagittis magna. Sed ensat, leo eget bibendum sodales, augue velit cursus nunc, quis gravida magna mi a libero. Fusce вулканизованный элемент. Vestibulum purus quam, scelerisque ut, mollis sed, nonummy id, metus. Нуллам паксан лорам в дуи. Cras ultricies mi eu turpis hendrerit fringilla. Vestibulum ante ipsum primis в faucibus orci luctus et ultrices posuere cubilia Curae; В ac dui quis mi consectetuer lacinia. Nam pretium turpis et arcu. Duis arcu tortor, suscit eget, incdiet nec, imperdiet iaculis, ipsum. Sed aliquam ultrices mauris. Integer ante arcu, accumsan a, consectetuer eget, posuere ut, mauris. Преданный adipiscing. Phasellus ullamcorper ipsum rutrum nunc. Nunc nonummy metus. Vestibulum volutpat pretium libero. Cras id dui. Aenean ut eros et nisl sagittis vestibulum. Nullam nulla eros, ultricies sit amet, nonummy id, imperdiet feugiat, pede. Сед. Donec mollis hendrerit risus. Phasellus nec sem in justo pellentesque facilisis. Etiam imperdiet imperdiet orci. Nunc nec neque. Phasellus leo dolor, tempus non, auctor et, hendrerit quis, nisi. Curabitur ligula sapien, tincidunt non, euismod vitae, posuere imperdiet, leo. Maecenas malesuada. Преданный конгут уничтожается в массе. Sed cursus turpis vitae tortor. Donec posuere vulputate arcu. Phasellus accumsan cursus velit. Vestibulum ante ipsum primis в faucibus orci luctus et ultrices posuere cubilia Curae; Sed aliquam, nisi quis porttitor congue, elit erat euismod orci, ac placerat dolor lectus quis orci. Phasellus consectetuer vestibulum elit. Aenean tellus metus, bibendum sed, posuere ac, mattis non, nunc. Vestibulum fringilla pede сидит amet augue. В турписе. Pellentesque posuere. Преподобный turpis. Aenean posuere, tortor sed cursus feugiat, nunc augue blandit nunc, eu sollicitudin urna dolor sagittis lacus. Donec elit libero, sodales nec, volutpat a, suscipit non, turpis. Nullam sagittis. Suspendisse pulvinar, augue ac venenatis condimentum, sem libero volutpat nibh, nec pellentesque velit pede quis nunc. Vestibulum ante ipsum primis в faucibus orci luctus et ultrices posuere cubilia Curae; Fusce id purus. Ut varius tincidunt libero. Фазеллус долор. Maecenas vestibulum mollis diam. Pellentesque ut neque. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. В dui magna, posuere eget, vestibulum et, tempor auctor, justo. В ac felis quis tortor malesuada pretium. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. В hac habitasse platea dictumst. Curabitur при locus. Cura

Ответ 3

Символ UTF-8 составляет от 1 байта, поэтому он зависит от того, какой символ вы кодируете. В большинстве случаев английский использует 1 байт для каждого символа. Другие западные языки используют 2 байта. Азиатские символы могут использовать 4 байта.

Итак, ответ от 1024 до 4096 в зависимости от персонажей. Кроме того, в среде Windows вам может потребоваться 3-байтная спецификация в начале документа, которая уменьшит количество символов, которые вы можете поместить в 4Kb. См. Статью статьи по UTF-8.