Мне нужно проверить, является ли строка Unicode, а затем, если это UTF-8. После этого получите длину строки в байтах, включая спецификацию, если она когда-либо ее использует. Как это можно сделать в Python?
Также для дидактических целей, как выглядит представление списка байтов строки UTF-8? Мне любопытно, как строка UTF-8 представлена в Python.
Последнее редактирование: pprint делает это довольно хорошо.