У меня есть строка, описывающая структуру [значение оператора переменной], как это:
type == 'prova' && padposition == "stefano" or 10>var_name
Мне нужно построить регулярное выражение для извлечения списка имен переменных:
type
padposition
var_name
применить к ним постобработку (в основном, преобразовав их в ключ массива PHP):
$arr_name['type']
$arr_name['padposition']
$arr_name['var_name']
Я нашел способ сопоставления строки, разделенной одинарными или двойными кавычками:
('|")(\w*\w)('|")
но я не могу (я слишком невежественен!) отрицать это или просто извлечь любое слово без разделителей или двойных кавычек.
Способ сделать это (легко читаемый и простой в обслуживании):
$str = 'type == \'prova\' && padposition == "stefano" or 10>var_name';
$pattern = <<<'EOD'
~
# you define first the basic elements (as for a lexer) with named groups
(?(DEFINE)
(?<var> [a-z_]\w* ) # variable name
(?<dqstr> (?<=") [^\\"]*+ (?s:\\.[^\\"]*)*+ (?=") ) # double quoted string
(?<sqstr> (?<=') [^\\']*+ (?s:\\.[^\\']*)*+ (?=') ) # single quoted string
(?<string> \g<dqstr> | \g<sqstr> ) # any string
(?<num> [0-9]+(?:\.[0-9]+)? ) # a number
(?<value> \g<string> | \g<num> ) # any value
(?<comp> [!><=]= | =?[><] ) # comparison operator
)
# Then you write the pattern using these named groups
(?J) # allow duplicate named groups
# variable op value
(?<key> \g<var> ) \h* \g<comp> \h* ["']? (?<val> \g<value> ) ['"]?
| # OR
# value op variable
["']? (?<val> \g<value> ) ['"]? \h* \g<comp> \h* (?<key> \g<var> )
~xi
EOD;
if (preg_match_all($pattern, $str, $matches, PREG_SET_ORDER)) {
$arr_name = [];
foreach($matches as $m) {
$arr_name[$m['key']] = $m['val'];
}
print_r($arr_name);
}
Других решений пока нет …