У меня есть простой парсер BBCode:
function parse($text) {
$text = htmlspecialchars($text);
$text = nl2br($text);
$text = preg_replace("#\[b\](.*?)\[/b\]#si", '<b>\\1</b>', $text);
$text = preg_replace("#\[i\](.*?)\[/i\]#si", '<i>\\1</i>', $text);
$text = preg_replace("#\[u\](.*?)\[/u\]#si", '<u>\\1</u>', $text);
$text = preg_replace("#\[color=(.*?)\](.*?)\[/color\]#si", "<span style=\"color:\\1;\">\\2</span>", $text);
//and some more rules [...]
return $text;
}
Это хорошо, когда у меня простой ввод, но когда пользователь пытается использовать цвет в цвете, он не работает.
Например 1:
[b]bold[color=#f00]red[/color][i]italic[/i][/b]
все в порядке, но когда пользователь пытается что-то вроде примера 2:
[b]bold[color=#f00]red[color=#0f0]green[/color][/color][i]italic[/i][/b]
моя функция возвращает:
<b>bold<span style="color:#f00;">red[color=#0f0]green</span>[/color]<i>italic</i></b>
Конечно, пример 3 работает хорошо:
[b]bold[color=#f00]red[/color][color=#0f0]green[/color][i]italic[/i][/b]
У меня вопрос, есть ли какое-нибудь простое решение для создания чего-то вроде DOM и последующего разбора выражения?
Я хотел бы получить что-то вроде этого для 2-го примера:
<b>bold<span style="color:#f00;">red<span style="color:#0f0;">green</span></span><i>italic</i></b>
Вам следует изучить уже существующие решения, если вы хотите проанализировать сложный BBCode (см. Ссылку на статью, связанную в комментарии).
Однако, если вы готовы придерживаться своей собственной реализации, вы можете использовать рекурсивные регулярные выражения, например так:
<?php
function bbcodeColor($input)
{
$regex = '#\[color=(.*?)\](((?R)|.)*?)\[\/color\]#is';
if (is_array($input)) {
$input = '<span style="color:'.$input[1].';">'.$input[2].'</span>';
}
return preg_replace_callback($regex, 'bbcodeColor', $input);
}
echo bbcodeColor('[color=#f00]red[color=#0f0]green[/color][/color]');
// <span style="color:#f00;">red<span style="color:#0f0;">green</span></span>
Других решений пока нет …