Я хотел бы очистить содержимое этой страницы результатов поиска Google с помощью curl. Я пытаюсь установить различные пользовательские агенты и установить другие параметры, но я просто не могу получить содержимое этой страницы, поскольку меня часто перенаправляют или я получаю сообщение об ошибке страницы.
Я считаю, что это связано с тем, что строка запроса закодирована где-то, но я действительно не уверен, как обойти это.
//$url is the same as the link above
$ch = curl_init();
$user_agent='Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20100101 Firefox/8.0'
curl_setopt ($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_USERAGENT, $user_agent);
curl_setopt ($ch, CURLOPT_HEADER, 0);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch,CURLOPT_CONNECTTIMEOUT,120);
curl_setopt ($ch,CURLOPT_TIMEOUT,120);
curl_setopt ($ch,CURLOPT_MAXREDIRS,10);
curl_setopt ($ch,CURLOPT_COOKIEFILE,"cookie.txt");
curl_setopt ($ch,CURLOPT_COOKIEJAR,"cookie.txt");
echo curl_exec ($ch);
Что мне нужно сделать, чтобы мой PHP-код отображал точный контент страницы, как я бы увидел его в моем браузере? Что мне не хватает? Может ли кто-нибудь указать мне в правильном направлении?
Я видел похожие вопросы о SO, но ни один из них не мог ответить мне.
EDIT:
Я попытался просто открыть ссылку, используя Selenium WebDriver, которая дает те же результаты, что и cURL. Я все еще думаю, что это связано с тем, что в строке запроса есть специальные символы, которые запутываются где-то в этом процессе.