Я пишу script, который будет пытаться кодировать байты во множество разных кодировок в Python 2.6. Есть ли способ получить список доступных кодировок, которые я могу перебрать?
Причина, по которой я пытаюсь это сделать, состоит в том, что у пользователя есть текст, который не закодирован правильно. Есть забавные персонажи. Я знаю символ юникода, который испортил его. Я хочу дать им ответ, например: "Ваш текстовый редактор интерпретирует эту строку как кодировку X, а не Y-кодировку". Я думал, что попытаюсь кодировать этот символ с использованием одной кодировки, а затем снова декодировать его с помощью другой кодировки и посмотреть, получим ли мы такую же последовательность символов.
то есть. что-то вроде этого:
for encoding1, encoding2 in itertools.permutation(encodinglist(), 2):
try:
unicode_string = my_unicode_character.encode(encoding1).decode(encoding2)
except:
pass