По какой-то странной причине я не могу получить qi::as_string[]
работать с repeat()[]
,
анализ std::string str = { "{ +100S+++ ;\n }" };
Я получаю следующее ВЫХОД
PLUS OR MINUS+
THREE PLUS OR MINUS
PARSED FINE
-------------------------
Parsing succeeded
-------------------------
который показывает, что разбор был в порядке, первый +
был захвачен, но не последующие три +++
,
НОТА Я просто пытаюсь получить three_plus_or_minus
захватить от одного до трех плюсов или минусов подряд в виде строки. Альтернативные решения, которые не используют as_string[]
будет также оценен.
Я извиняюсь за длинный список, но мне нужно использовать и лексер, и парсер в моем реальном коде.
КОД
// -------------- Third Party --------------
#include <boost/config/warning_disable.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/lex_lexertl.hpp>
#include <boost/spirit/include/phoenix_operator.hpp>
// -------------- C++ stdlib --------------
#include <iostream>
#include <fstream>
#include <string>
using namespace boost::spirit;
using boost::phoenix::val;
enum token_ids
{
ID_CONSTANT = 1000,
ID_INTEGER,
ID_TAG,
ID_IDENTIFIER
};
template <typename Lexer>
struct example6_tokens : lex::lexer<Lexer>
{
example6_tokens()
{
identifier = "[a-zA-Z_][a-zA-Z0-9_]*";
constant = "[0-9]+";
tag = "sl|s|l|tl|SL|S|L|TSL|""z|r|i|Z|R|I|""<>|><|<<>>|>><<|><><|<><>";
this->self = lex::token_def<>('(') | ')' | '{' | '}'
| '=' | ';' | ':' | '+' | '-';
this->self.add
(constant, ID_CONSTANT )
(tag, ID_TAG )
(identifier, ID_IDENTIFIER )
;
this->self("WS")
= lex::token_def<>("[ \\t\\n]+")
| "\\/\\*[^*]*\\*+([^/*][^*]*\\*+)*\\/"| "\\/\\/[^\n]*";
}
lex::token_def<std::string> identifier, tag;
lex::token_def<unsigned int> constant;
};
// ----------------------------------------------------------------------------
template <typename Iterator, typename Lexer>
struct example6_grammar
: qi::grammar<Iterator, qi::in_state_skipper<Lexer> >
{
template <typename TokenDef>
example6_grammar(TokenDef const& tok)
: example6_grammar::base_type(program)
{
using boost::spirit::_val;
program
= +block
;
block
= '{' >> *slsltl_stmt >> '}'
;
plus_or_minus
%= ( qi::as_string[ qi::lit( '+' ) ] | qi::as_string[ '-' ])
[
std::cout << val("PLUS OR MINUS") << val( _1 ) << "\n"]
;
three_plus_or_minus
%= ( qi::as_string[ repeat(1,3)['+'] ] | qi::as_string[ repeat(1,3)['-'] ] )
[
std::cout << val("THREE PLUS OR MINUS") << val( _1 ) << "\n"]
;
slsltl_stmt
= ( - plus_or_minus
>> token(ID_CONSTANT)
>> token(ID_TAG)
>> three_plus_or_minus
>> ';'
)
[
std::cout << val("PARSED FINE") << "\n"]
;
expression
= tok.identifier [ _val = _1 ]
| tok.constant [ _val = _1 ]
;
}
typedef boost::variant<unsigned int, std::string> expression_type;
qi::rule<Iterator, qi::in_state_skipper<Lexer> > program, block;
qi::rule<Iterator, std::string(), qi::in_state_skipper<Lexer> >
plus_or_minus, three_plus_or_minus;
qi::rule<Iterator, std::string(), qi::in_state_skipper<Lexer> > slsltl_stmt;
qi::rule<Iterator, expression_type(), qi::in_state_skipper<Lexer> > expression;
};
int
main( int argv, char* argc[] )
{
typedef std::string::iterator base_iterator_type;
typedef lex::lexertl::token<
base_iterator_type, boost::mpl::vector<unsigned int, std::string>
> token_type;
typedef lex::lexertl::lexer<token_type> lexer_type;
typedef example6_tokens<lexer_type> example6_tokens;
typedef example6_tokens::iterator_type iterator_type;
typedef example6_grammar<iterator_type, example6_tokens::lexer_def> example6_grammar;
example6_tokens tokens; // Our lexer
example6_grammar calc(tokens); // Our parser
std::string str = { "{ +100S+++ ;\n }" };
std::string::iterator it = str.begin();
iterator_type iter = tokens.begin(it, str.end());
iterator_type end = tokens.end();
std::string ws("WS");
bool r = qi::phrase_parse(iter, end, calc, qi::in_state(ws)[tokens.self]);
if (r && iter == end)
{
std::cout << "-------------------------\n";
std::cout << "Parsing succeeded\n";
std::cout << "-------------------------\n";
}
else
{
std::cout << "-------------------------\n";
std::cout << "Parsing failed\n";
std::cout << "-------------------------\n";
}
}
Пытаться
slsltl_stmt %= /*....*/;
Вместо slsltl_stmt =
, Использование семантических действий отключает автоматическое распространение атрибутов.
(Я еще не посмотрел остальную часть вашего кода. Может быть, больше мест, где эти / другие вещи нужно адаптировать)
редактировать
Я сделал еще несколько испытаний и думаю, что это делает то, что вы ожидали:
three_plus_or_minus
= (qi::as_string[ repeat(1,3)[qi::char_('+')] | repeat(1,3)[qi::char_('-')] ])
[ std::cout << val("THREE PLUS OR MINUS") << _1 << "\n" ]
;
Впрочем, вопрос из коробки: почему вы используете Lexer? Не имеет ли смысл иметь токен для +++
?
Других решений пока нет …