$string = file_get_contents('http://example.com');
if ('UTF-8' === mb_detect_encoding($string)) {
$dom = new DOMDocument();
// hack to preserve UTF-8 characters
$dom->loadHTML('<?xml encoding="UTF-8">' . $string);
$dom->preserveWhiteSpace = false;
$dom->encoding = 'UTF-8';
$body = $dom->getElementsByTagName('body');
echo htmlspecialchars($body->item(0)->nodeValue);
}
Это изменяет все символы UTF-8 на Å, ¾, ¤ и другой мусор. Есть ли другой способ сохранения символов UTF-8?
Не публикуйте ответы, говорящие мне, чтобы убедиться, что я выводил его как UTF-8, я убедился, что я.
Заранее спасибо:)