simplexml не загружает & lt; a & gt; теги классов?

У меня есть немного PHP, который захватывает HTML со страницы и загружает его в объект Simplexml. Однако не получить классы элемента в пределах

Php

//load the html page with curl
$html = curl_exec($ch);
curl_close($ch);

$doc = new DOMDocument();
$doc->loadHTML($html);
$sxml = simplexml_import_dom($doc);

Страница html. Который, если я сделаю var_dump из $ html, он будет очищен и существует в $ html

    <li class="large">
<a style="" id="ref_3" class="off" href="#" onmouseover="highlightme('07');return false;" onclick="req('379');return false;" title="">07</a>
</li>

Var_dump (ниже) из $ doc и $ sxml показывает, что класс «off» теперь отсутствует. К сожалению, мне нужно обработать страницу на основе этого класса.

            [8]=>
object(SimpleXMLElement)#50 (2) {
["@attributes"]=>
array(1) {
["class"]=>
string(16) "large"}
["a"]=>
string(2) "08"}

4

Решение

С помощью simplexml_load_file а также xpathсм. встроенные комментарии.

Что вам нужно, действительно, как только вы нашли нужный элемент, это

$row->a->attributes()->class=="off"

И полный код ниже:

// let's take all the divs that have the class "stff_grid"$divs = $xml->xpath("//*[@class='stff_grid']");

// for each of these elements, let's print out the value inside the first p tag
foreach($divs as $div){
print $div->p->a . PHP_EOL;

// now for each li tag let's print out the contents inside the a tag
foreach ($div->ul->li as $row){

// same as before
print "  - " . $row->a;
if ($row->a->attributes()->class=="off") print " *off*";
print PHP_EOL;

// or shorter
// print "  - " . $row->a . (($row->a->attributes()->class=="off")?" *off*":"") . PHP_EOL;

}
}
/* this outputs the following
Person 1
- 1 hr *off*
- 2 hr
- 3 hr *off*
- 4 hr
- 5 hr
- 6 hr *off*
- 7 hr *off*
- 8 hr
Person 2
- 1 hr
- 2 hr
- 3 hr
- 4 hr
- 5 hr
- 6 hr
- 7 hr *off*
- 8 hr *off*
Person 3
- 1 hr
- 2 hr
- 3 hr
- 4 hr *off*
- 5 hr
- 6 hr
- 7 hr *off*
- 8 hr
*/
1

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]