Я использую следующий код для очистки веб-страницы:
$ch =curl_init("http://www.trivago.de/?aDateRange%5Barr%5D=2015-08-07&aDateRange%5Bdep%5D=2015-08-10&iRoomType=7&bIsTotalPrice=false&iPathId=3577&iGeoDistanceItem=1473453&iViewType=0&bIsSeoPage=false&bIsSitemap=false&");
$fp = fopen("example_homepage.txt", "w");
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_setopt($ch, CURLOPT_HEADER, 0);
$output = curl_exec($ch);
curl_close($ch);
Но веб-страница, которую я получаю, неверна или не полностью соответствует реальной странице.
Я получаю это неполное:
И настоящая веб-страница такова:
Актуальная страница
Предполагается, что ваш CURL будет выглядеть аналогично для поставленной задачи:
$ch = curl_init();
curl_setopt($ch,CURLOPT_URL,'http://yourwebiste.com');
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,5); //5 seconds
$result = curl_exec($ch); //$result now holds fetched data
curl_close($ch);
Код является частью моей собственной библиотеки CURL. Помните, что вы не загружаете файл, а возвращаете содержимое HTML.
Других решений пока нет …