Как я могу получить href, Image src, заголовок из данного HTML, используя DomDocument

Учитывая HTML —

  <div id="testid">
<h1>Test Title</h1>
<ul class="clearfix">
<li class="anker" id="artists-A"></li>
<li class="first">
<a href="www.test1.html" title="Test1">
<span>
<img src="https://www.test1.de/img/test1.jpg" alt="Test1" />
<span>Test1</span>
</span>
</a>
</li>
<li>
<a href="www.test2.html" title="Test2">
<span>
<img src="https://www.test2.de/img/test2.jpg" alt="Test2" />
<span>Test2</span>
</span>
</a>
</li>
<li class="first">
<a href="www.test3.html" title="Test3">
<span>
<img src="https://www.test1.de/img/test3.jpg" alt="Test3" />
<span>Test3</span>
</span>
</a>
</li>
</ul>
</div>

Нужно получить значение href, img src и span т.е. название.
Я анализирую это с помощью domDocument, но не получаю точный результат.

Код:

$doc = new DomDocument;
$doc->validateOnParse = true;
$doc->loadHtml(file_get_contents($url));
$xpath = new DOMXPath($doc);
$nodes = $xpath->query('//[@id="testid"]/ul/li');

2

Решение

Здесь мы используем DOMDocument. Сейчас я собираю a«s href а также img«s src, вы можете добавить еще больше тегов, которые вы хотите.

Попробуйте этот фрагмент кода здесь

$domDocument = new DOMDocument();
$domDocument->loadHTML($string);

$domXPath = new DOMXPath($domDocument);
$results = $domXPath->query("//div[@id='testid']");//querying div with id="testid"$results = $domXPath->query("//a|//img",$results->item(0))//querying resultant div for a and img
$data=array();
foreach($results as $result){
if($result->tagName=="a")//checking for anchor tags
{
$data["a"][]=array(
"href"=>$result->getAttribute("href"),
"title"=>$result->getAttribute("title")
);
}
elseif($result->tagName=="img")//checking for image tags
{
$data["img"][]=$result->getAttribute("src");
}
}
print_r($data);
1

Другие решения

Я предлагаю вам использовать SimpleHtmlDom библиотека.

<?php

require_once "SimpleHtmlDom.php";

// put in file contentToParse.html your html code
$htmlToParse = file_get_contents("contentToParse.html");

$htmlObject = str_get_html($htmlToParse);

$resultObject = array();foreach($htmlObject->find("#testid ul li a") as $singleLink)
{
var_dump($singleLink->href);
}
foreach($htmlObject->find("#testid ul li img") as $singleImage)
{
var_dump($singleImage->src);
}
foreach($htmlObject->find("#testid ul li span span") as $singleSpan)
{
var_dump($singleSpan->innertext);
}
?>
0

По вопросам рекламы ammmcru@yandex.ru
Adblock
detector