У меня есть немного PHP, который захватывает HTML со страницы и загружает его в объект Simplexml. Однако не получить классы элемента в пределах
Php
//load the html page with curl
$html = curl_exec($ch);
curl_close($ch);
$doc = new DOMDocument();
$doc->loadHTML($html);
$sxml = simplexml_import_dom($doc);
Страница html. Который, если я сделаю var_dump из $ html, он будет очищен и существует в $ html
<li class="large">
<a style="" id="ref_3" class="off" href="#" onmouseover="highlightme('07');return false;" onclick="req('379');return false;" title="">07</a>
</li>
Var_dump (ниже) из $ doc и $ sxml показывает, что класс «off» теперь отсутствует. К сожалению, мне нужно обработать страницу на основе этого класса.
[8]=>
object(SimpleXMLElement)#50 (2) {
["@attributes"]=>
array(1) {
["class"]=>
string(16) "large"}
["a"]=>
string(2) "08"}
С помощью simplexml_load_file
а также xpath
см. встроенные комментарии.
Что вам нужно, действительно, как только вы нашли нужный элемент, это
$row->a->attributes()->class=="off"
И полный код ниже:
// let's take all the divs that have the class "stff_grid"$divs = $xml->xpath("//*[@class='stff_grid']");
// for each of these elements, let's print out the value inside the first p tag
foreach($divs as $div){
print $div->p->a . PHP_EOL;
// now for each li tag let's print out the contents inside the a tag
foreach ($div->ul->li as $row){
// same as before
print " - " . $row->a;
if ($row->a->attributes()->class=="off") print " *off*";
print PHP_EOL;
// or shorter
// print " - " . $row->a . (($row->a->attributes()->class=="off")?" *off*":"") . PHP_EOL;
}
}
/* this outputs the following
Person 1
- 1 hr *off*
- 2 hr
- 3 hr *off*
- 4 hr
- 5 hr
- 6 hr *off*
- 7 hr *off*
- 8 hr
Person 2
- 1 hr
- 2 hr
- 3 hr
- 4 hr
- 5 hr
- 6 hr
- 7 hr *off*
- 8 hr *off*
Person 3
- 1 hr
- 2 hr
- 3 hr
- 4 hr *off*
- 5 hr
- 6 hr
- 7 hr *off*
- 8 hr
*/
Других решений пока нет …