Я получаю содержимое веб-страницы, сохраненное в текстовом файле с помощью: PHP Simple HTML DOM Parser.
Сохранение этого в текстовом файле. Далее я хочу получить контент, который находится между pre и / pre. (с html скобками)
(только если вам интересно, я хочу только информацию о музыкальной вкладке, например: http://www.guitaretab.com/p/pink-floyd/14683.html)
Я делаю это с:
$first_step = explode( '<pre>' , $page );
$second_step = explode("</pre>" , $first_step[1] );
echo $second_step[0];
Проблема у меня заключается в том, что в моем файле .txt текст хорошо отформатирован, с аккордами над лирикой с пробелами / табуляцией и вводится так:
G C
Heavy hung the canopy of blue
G C
Shade my eyes and I can see you
Строка эха приводит к тому, что все, что стоит в одной строке, не входит и т.д. Я не знаю, что я могу сделать, чтобы предотвратить это. Спасибо, если вы можете указать мне в правильном направлении.
Вы можете использовать php pregreplace
preg_replace(/\s+/g, ' ',$string);
это будет эхо без предварительных тегов
$pos = strpos($page, '<pre>')+5;
$length = strpos($page, '</pre>') - $pos;
echo strip_tags(substr($page, $pos, $length));
это будет повторяться с предварительно тегами
$pos = strpos($page, '<pre>')+5;
$length = strpos($page, '</pre>') - $pos;
echo '<pre>' . strip_tags(substr($page, $pos, $length) . '<pre>';