У меня есть следующая подпрограмма кода, которая preg_match с элементами XML и печать атрибутов этих элементов.
Однако в некоторых тегах содержимое не отображается в одной строке (тег SCRIPT) и поэтому не сопоставляется.
Мне интересно, как смотреть вперед и собирать все строки до закрывающего тега «/>»?
Можно ли использовать символ @ где-то в preg_match, чтобы разрешить новые строки?
Я даже не уверен, как решить эту проблему. Я сделал песочницу PHP, чтобы код можно было проверить онлайн:
http://sandbox.onlinephpfunctions.com/code/f96daef33fb49179eee30250ded81af6a8e5c567
Если я удаляю все данные в теге script, все, кроме первой строки, он корректно выводит массив.
$file = ' <TOPTAG class="Menu" text="FCLPHP" >
<TAG1 name="contain=" />
<SCRIPT name="check()" script="if(B3||B4||B5 == 1){
do(ABC,0);
do(BCD,1);" />
</WINDOW>
';
//split the string into an array based on new line
$lines = explode("\n", $file);
//count the number of lines
$linesLength = count($lines);
for($index = 0; $index < $linesLength; $index++){
//reads all element atrributes from the TOPTAG element
$reads = element_attributes('TOPTAG',$lines[$index]);
//reads all element atrributes from the SCRIPT element
$scripts = element_attributes('SCRIPT',$lines[$index]);
//prints the script tag attributes
print_r($scripts);
}function element_attributes($element_name, $xml) {
if ($xml == false) {
return false;
}
// Grab the string of attributes inside an element tag.
$found = preg_match('#<'.$element_name.
'\s+([^>]+(?:"|\'))\s?/?>#',
$xml, $matches);
if ($found == 1) {
$attribute_array = array();
$attribute_string = $matches[1];
// Match attribute-name attribute-value pairs.
$found = preg_match_all(
'#([^\s=]+)\s*=\s*(\'[^<\']*\'|"[^<"]*")#',
$attribute_string, $matches, PREG_SET_ORDER);
if ($found != 0) {
// Create an associative array that matches attribute
// names to attribute values.
foreach ($matches as $attribute) {
$attribute_array[$attribute[1]] =
substr($attribute[2], 1, -1);
}
return $attribute_array;
}
}
// Attributes either weren't found, or couldn't be extracted
// by the regular expression.
return false;
}
Ваше регулярное выражение работает через несколько строк. Проблема в том, что вы используете его только по одной строке за раз, поэтому он никогда не видит продолжения. Не разбивайте файл на строки, просто работайте с ним как с одной строкой.
$reads = element_attributes('TOPTAG',$file);
$scripts = element_attributes('SCRIPT',$file);
Других решений пока нет …