Использование Xpath с php для анализа html с сайта

В настоящее время я пытаюсь использовать xpath для анализа HTML-страницы с веб-сайта.

Мне нужно получить результат в формате:

Время программы: Название программы

Например:

13:00: Ye Hai Mohabbatein

Я использую следующий код (как показано Вот) чтобы получить его, но он не работает.

<?php

libxml_use_internal_errors(true);
$dom = new DomDocument;
$dom->loadHTMLFile("www.starplus.in/schedule.aspx");
$xpath = new DomXPath($dom);
$nodes = $xpath->query("//table");
foreach ($nodes as $i => $node) {
echo "hy";
echo "Node($i): ", $node->nodeValue, "\n";
}

?>

Я буду благодарен, если кто-нибудь поможет мне в этом вопросе.

1

Решение

По сути, просто наведите таблицу div / table, которая имеет название шоу и временной интервал.

Грубый пример:

// it seems it doesn't work when there is no user agent
$ch = curl_init('http://www.starplus.in/schedule.aspx');
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$page = curl_exec($ch);

$dom = new DOMDocument;
libxml_use_internal_errors(true);
$dom->loadHTML($page);
libxml_clear_errors();
$xpath = new DOMXPath($dom);

$shows = array();
$tables = $xpath->query("//div[@class='sech_div_bg']/table"); // target that table

foreach ($tables as $table) {
$time_slot = $xpath->query('./tr[1]/td/span', $table)->item(0)->nodeValue;
$show_name = $xpath->query('./tr[3]/td/span', $table)->item(0)->nodeValue;
$shows[] = array('time_slot' => $time_slot, 'show_name' => $show_name);
echo "$time_slot - $show_name <br/>";
}

// echo '<pre>';
// print_r($shows);
2

Другие решения

Других решений пока нет …

По вопросам рекламы ammmcru@yandex.ru
Adblock
detector