Получить содержимое & lt; script type = & quot; application / ld + json & quot; & gt; использование переполнения стека

Я не могу найти API для Vine, чтобы получить заголовок, описание и изображение содержимого страницы. JSON находится в теле самой страницы в теге script:. Как получить содержимое (JSON) этого тега сценария с помощью PHP, чтобы его можно было проанализировать?

Винная страница:

https://vine.co/v/igO3EbIXDlI

Из источника страницы

<script type="application/ld+json">
{
"@context": "http://schema.org",
"@type": "SocialMediaPosting",
"url": "https://vine.co/v/igO3EbIXDlI",
"datePublished": "2016-03-01T00:58:35",
"author": {
"@type": "Person",
"name": "MotorAddicts\u2122",
"image": "https://v.cdn.vine.co/r/avatars/39FEFED72B1242718633613316096_pic-r-1439261422661708f3e9755.jpg.jpg?versionId=LPjQUQ4KmTIPLu3iDbXw4FipgjEpC6fw",
"url": "https://vine.co/u/989736283540746240"},
"articleBody": "Mmm...  Black black blaaaaack!! \ud83d\ude0d ( Drift \u53d1 )",
"image": "https://v.cdn.vine.co/r/videos/98C3799A811316254965085667328_SW_WEBM_14567938452154dc600dbde.webm.jpg?versionId=wPuaQvDxnpwF7KjSGao21hoddooc3eCl",
"interactionCount": [{
"@type": "UserInteraction",
"userInteractionType": "http://schema.org/UserLikes",
"value": "1382"}, {
"@type": "UserInteraction",
"userInteractionType": "http://schema.org/UserShares",
"value": "368"}, {
"@type": "UserInteraction",
"userInteractionType": "http://schema.org/UserComments",
"value": "41"}, {
"@type": "UserInteraction",
"userInteractionType": "http://schema.org/UserViews",
"value": "80575"}],

"sharedContent": {
"@type": "VideoObject",
"name" : "Mmm...  Black black blaaaaack!! \ud83d\ude0d ( Drift \u53d1 )",
"description" : "",
"thumbnailUrl" : "https://v.cdn.vine.co/r/videos/98C3799A811316254965085667328_SW_WEBM_14567938452154dc600dbde.webm.jpg?versionId=wPuaQvDxnpwF7KjSGao21hoddooc3eCl",
"uploadDate" : "2016-03-01T00:58:35",
"contentUrl" : "https://v.cdn.vine.co/r/videos_h264high/98C3799A811316254965085667328_SW_WEBM_14567938452154dc600dbde.mp4?versionId=w7ugLPYtj5LWeVUsXaH1bt2VuK8QE0qv",
"embedUrl" : "https://vine.co/v/igO3EbIXDlI/embed/simple",
"interactionCount" : "82366"}
}
</script>

Что делать после этого?

$html = 'https://vine.co/v/igO3EbIXDlI';
$dom = new DOMDocument;
$dom->loadHTML($html);

Обновить:

Я нашел инструкции для Vine API здесь:

https://dev.twitter.com/web/vine/oembed

Чтобы запросить Vine API для JSON, получите запрос от:

https://vine.co/oembed.json?url=https%3A%2F%2Fvine.co%2Fv%2F[videoid]

Пример:

https://vine.co/oembed.json?url=https%3A%2F%2Fvine.co%2Fv%2FMl16lZVTTxe

2

Решение

Ты можешь использовать DOMDocument а также DOMXpath за это:

$html = file_get_contents( $url );
$dom  = new DOMDocument();
libxml_use_internal_errors( 1 );
$dom->loadHTML( $html );
$xpath = new DOMXpath( $dom );

$jsonScripts = $xpath->query( '//script[@type="application/ld+json"]' );
$json = trim( $script->item(0)->nodeValue );

$data = json_decode( $json );

phpFiddle demo

С этим шаблоном xPath вы ищете все <script> узлы с атрибутом тип как «application / ld + json»:

//                              Following path no matter where they are in the document
script                          Elements <script>
[@type="application/ld+json"]   with attribute “tipe” as “application/ld+json”

Затем вы получаете свою строку JSON, получая ->nodeValue из первых вернулся <script> узел.

Если вы не знаете заранее существование узла и / или его положение, используйте это:

$jsonScripts = $xpath->query( '//script[@type="application/ld+json"]' );
if( $jsonScript->length < 1 )
{
die( "Error: No script node found" );
}
else
{
foreach( $jsonScripts as $node )
{
$json = json_decode( $node->nodeValue );

// your stuff with JSON here...
}
}
4

Другие решения

$html_content = file_get_contents('https://vine.co/v/igO3EbIXDlI');

$target_class = 'script';

$dom_object = new DOMDocument;
$dom_object->loadHTML($html_content);
$xpath_object = new DOMXpath($dom_object);

$elements = $xpath_object->query("//*[contains(concat(' ', normalize-space(@class), ' '), ' {$target_class} ')]");

$output = []
foreach ($elements as $element)
{
$output[] = $dom_object->saveHTML($element);
}

# you now have a list of strings, each containing the contents of a
# non-overlapping script tag
0

По вопросам рекламы [email protected]