При вставке текста из внешних источников в текстовый редактор (например, TextMate или Sublime Text 2) общая проблема заключается в том, что специальные символы также часто вставляются. Некоторые из этих символов отображаются отлично, но в зависимости от источника некоторые могут отображаться неправильно (обычно они отображаются как вопросительный знак с полем вокруг него).
Итак, это на самом деле 2 вопроса:
-
С учетом специального символа (например, или ♥) можно определить код символа UTF-8, используемый для отображения этого символа внутри текстового редактора, и/или преобразовать эти символы в коды символов?
-
Для тех "особо специальных" символов, которые появляются как мусор, есть ли способ выяснить, какая кодировка использовалась для отображения этого символа в исходном тексте, и могут ли эти символы каким-то образом преобразовываться в UTF- 8?