Мой Curl-код работает:
$ch = curl_init();
$header = array(
'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7',
'Accept-Language: en-us;q=0.8,en;q=0.6'
);
$options = array(
CURLOPT_URL => $url,
CURLOPT_HEADER => 0,
CURLOPT_RETURNTRANSFER => 1,
CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
CURLOPT_HTTPHEADER => $header
);
curl_setopt_array($ch, $options);
$str = curl_exec($ch);
curl_close($ch);
Но только с одной страницы я начинаю получать знаки так:
‹ í} ëvâH²îïîµö; dk¦} ™ ² …
С помощью mb_detect_encoding я обнаруживаю, что это строка utf8. Я запутался, почему я не могу прочитать исходный код, как с других сайтов?
Сайт, который я хочу свернуть http://stores.ebay.com/artlines-2012
Спасибо.
Это похоже на проблему кодировки. Попробуйте добавить CURLOPT_ENCODING
,
Пример:
curl_setopt($ch, CURLOPT_ENCODING, 'UTF-8');
Других решений пока нет …