xml — Как получить первое изображение из RSS-потока tumlbr в Stack Overflow

Question

xml — Как получить первое изображение из RSS-потока tumlbr в Stack Overflow

0 Вот соответствующая часть моего RSS-канала:

    <channel>
<description></description>
<title>Untitled</title>
<generator>Tumblr (3.0; @xxx)</generator>
<link>http://xxx.tumblr.com/</link>
<item>
<title>Title</title>
<description>&lt;figure&gt;&lt;img src="https://31.media.tumblr.com/c78c7t3abd23423549d3bb0f705/tumblr_inline_nkp9z234d0uj.jpg"/&gt;&lt;/figure&gt;</description>
<link>http://xxx.tumblr.com/post/99569244093</link>
<guid>http://xxx.tumblr.com/post/99569244093</guid>
<pubDate>Thu, 09 Oct 2014 11:19:33 -0400</pubDate>
</item>
</channel>

Используя ответ на другие вопросы здесь, я попробовал это:

$content = file_get_contents("http://xxx.tumblr.com/rss");
$feed = new SimpleXmlElement($content);
$imgs = $feed->channel->item[0]->description->xpath('//img');
foreach($imgs as $image) {
echo (string)$image['src'];
};

Это возвращает пустой массив для $imgs

Это как-то связано с тем, что теги < > так далее?

и если да, что я могу сделать?

0

php rss tumblr xml xpath

Решение

Другие решения

Прежде чем вы сможете использовать xapth() в описании вам необходимо создать из него новый XML-документ:

$url  = "http://xxx.tumblr.com/rss";
$desc = simplexml_load_file($url)->xpath('//item/description[1]')[0];
$src  = simplexml_load_string("<x>$desc</x>")->xpath('//img/@src')[0];

echo $src;

Выход:

http://40.media.tumblr.com/58d24c3009638514325b113859ba369f/tumblr_nk0mwfhKXU1sl87kjo1_500.jpg

1

Я не уверен, что вы можете использовать этот подход — как уже упоминалось kjhughes в качестве комментария, ваш входной XML не содержит никаких img элемент. Но можно получить источник изображения с помощью подстрок-функций XPath:

substring-before(substring-after(substring-after(//item/description[contains(.,'img')],
'src='),'"'),'"')

Результат:

https://31.media.tumblr.com/c78c7t3abd23423549d3bb0f705/tumblr_inline_nkp9z234d0uj.jpg

0

Источник

Accepted Answer

Вы можете получить его из описания, которое, кажется, включает в себя тег изображения HTML для изображения, используя простое регулярное выражение с preg_match:

$content = file_get_contents("http://xxx.tumblr.com/rss");
$feed    = new SimpleXmlElement($content);
$img     = (string)$feed->channel->item[0]->description;

if (preg_match('/src="(.*?)"/', $img, $matches)) {
$src = $matches[1];
echo "src = $src", PHP_EOL;
}

Выход:

src = http://40.media.tumblr.com/58d24c3009638514325b113859ba369f/tumblr_nk0mwfhKXU1sl87kjo1_500.jpg

1