Я пытаюсь перекодировать кучу файлов из US-ASCII в UTF-8.
Для этого я использую iconv:
iconv -f US-ASCII -t UTF-8 file.php > file-utf8.php
Thing - мои исходные файлы, кодированные US-ASCII, что делает невозможным преобразование. По-видимому, это происходит потому, что ASCII является подмножеством UTF-8...
http://www.linuxquestions.org/info/linux-software-2/iconv-us-ascii-to-utf-8-or-iso-8859-15-a-705054/
И цитирование:
Нет необходимости, чтобы текстовый файл появлялся иначе, пока не-ascii вводятся символы
True. Если я введу в файл не-ASCII-символ и сохраню его, скажем, с Eclipse, кодировка файла (charset) переключается на UTF-8.
В моем случае я хотел бы заставить iconv перекодировать файлы на UTF-8 в любом случае. Есть ли в нем символы, отличные от ASCII, или нет.
Примечание. Причина в том, что мой PHP-код (файлы, отличные от ASCII...) имеет дело с некоторой строкой, отличной от ASCII, что приводит к тому, что строки не могут быть хорошо интерпретированы (французский):
Il à © tait une fois... l'homme sà © rie animà © e mythique d'Albert
Barillà © (Procidis), 1ère
...
ИЗМЕНИТЬ
-
US-ASCII
- - подмножествоUTF-8
(см. ответ Ned ниже) - Значение
US-ASCII
файлов действительно закодировано вUTF-8
- Моя проблема возникла где-то в другом месте