Boost :: spirit (classic) примитивы против пользовательских парсеров

Question

Boost :: spirit (classic) примитивы против пользовательских парсеров

Я новичок в Boost :: spirit и хочу определить грамматику, которая анализирует язык TTCN.
(http://www.trex.informatik.uni-goettingen.de/trac/wiki/ttcn-3_4.5.1)
Я пытаюсь определить некоторые правила для «простых» синтаксических анализаторов, таких как Alpha, AlphaNum, которые должны быть верны от 1 до 1 к исходной грамматике, но, очевидно, я делаю что-то не так, потому что грамматика, определенная таким образом, не работает.
Но когда я использую анализаторы примитивов вместо TTCN, это начало работать.

Может кто-нибудь сказать, почему «вручную» определенные правила не работают, как ожидалось?
Как это исправить, потому что я хотел бы придерживаться оригинальной грамматики.
Это ошибка кода начинающего или что-то другое?

#define BOOST_SPIRIT_DEBUG

#include <boost/spirit/include/classic_symbols.hpp>
#include <boost/spirit/include/classic_tree_to_xml.hpp>
#include <boost/spirit/include/classic_position_iterator.hpp>
#include <boost/spirit/include/classic_core.hpp>
#include <boost/spirit/include/classic_parse_tree.hpp>
#include <boost/spirit/include/classic_ast.hpp>
#include <iostream>
#include <string>
#include <boost/spirit/home/classic/debug.hpp>
using namespace boost::spirit::classic;
using namespace std;
using namespace BOOST_SPIRIT_CLASSIC_NS;

typedef node_iter_data_factory<int> factory_t;
typedef position_iterator<std::string::iterator> pos_iterator_t;
typedef tree_match<pos_iterator_t, factory_t> parse_tree_match_t;
typedef parse_tree_match_t::const_tree_iterator iter_t;struct ParseGrammar: public grammar<ParseGrammar>
{
template<typename ScannerT>
struct definition
{
definition(ParseGrammar const &)
{
KeywordImport = str_p("import");
KeywordAll = str_p("all");
SemiColon = ch_p(';');
Underscore = ch_p('_');

NonZeroNum = range_p('1','9');
Num = ch_p('0') | NonZeroNum;
UpperAlpha = range_p('A', 'Z');
LowerAlpha = range_p('a', 'z');
Alpha = UpperAlpha | LowerAlpha;
AlphaNum = Alpha | Num;

//this does not!
Identifier = lexeme_d[Alpha >> *(AlphaNum | Underscore)];

// Uncomment below line to make rule work
// Identifier = lexeme_d[alpha_p >> *(alnum_p | Underscore)];

Module = KeywordImport >> Identifier >> KeywordAll >> SemiColon;

BOOST_SPIRIT_DEBUG_NODE(Module);
BOOST_SPIRIT_DEBUG_NODE(KeywordImport);
BOOST_SPIRIT_DEBUG_NODE(KeywordAll);
BOOST_SPIRIT_DEBUG_NODE(Identifier);
BOOST_SPIRIT_DEBUG_NODE(SemiColon);
}

rule<ScannerT> KeywordImport,KeywordAll,Module,Identifier,SemiColon;
rule<ScannerT> Alpha,UpperAlpha,LowerAlpha,Underscore,Num,AlphaNum;
rule<ScannerT> NonZeroNum;
rule<ScannerT> const&
start() const { return Module; }
};
};

int main()
{
ParseGrammar resolver;    //  Our parser
BOOST_SPIRIT_DEBUG_NODE(resolver);

string content = "import foobar all;";

pos_iterator_t pos_begin(content.begin(), content.end());
pos_iterator_t pos_end;

tree_parse_info<pos_iterator_t, factory_t> info;
info = ast_parse<factory_t>(pos_begin, pos_end, resolver, space_p);

std::cout << "\ninfo.length : " << info.length << std::endl;
std::cout << "info.full   : " << info.full << std::endl;

if(info.full)
{
std::cout << "OK: Parsing succeeded\n\n";
}
else
{
int line = info.stop.get_position().line;
int column = info.stop.get_position().column;
std::cout << "-------------------------\n";
std::cout << "ERROR: Parsing failed\n";
std::cout << "stopped at: " << line  << ":" << column << "\n";
std::cout << "-------------------------\n";
}
return 0;
}

2

boost boost-spirit c++parsing ttcn

Решение

Другие решения

Других решений пока нет …

Источник

Accepted Answer

Я не делаю Spirit Classic (которая уже несколько лет устарела).

Я могу только предположить, что вы что-то перепутали со шкиперами. Вот что переведено в Spirit V2:

#define BOOST_SPIRIT_DEBUG
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/support_line_pos_iterator.hpp>

namespace qi = boost::spirit::qi;

typedef boost::spirit::line_pos_iterator<std::string::const_iterator> pos_iterator_t;

template <typename Iterator = pos_iterator_t, typename Skipper = qi::space_type>
struct ParseGrammar: public qi::grammar<Iterator, Skipper>
{
ParseGrammar() : ParseGrammar::base_type(Module)
{
using namespace qi;
KeywordImport = lit("import");
KeywordAll    = lit("all");
SemiColon     = lit(';');

#if 1
// this rule obviously works
Identifier = lexeme [alpha >> *(alnum | '_')];
#else
// this does too, but less efficiently

Underscore    = lit('_');
NonZeroNum    = char_('1','9');
Num           = char_('0') | NonZeroNum;
UpperAlpha    = char_('A', 'Z');
LowerAlpha    = char_('a', 'z');
Alpha         = UpperAlpha | LowerAlpha;
AlphaNum      = Alpha | Num;

Identifier = lexeme [Alpha >> *(AlphaNum | Underscore)];
#endif

Module = KeywordImport >> Identifier >> KeywordAll >> SemiColon;

BOOST_SPIRIT_DEBUG_NODES((Module)(KeywordImport)(KeywordAll)(Identifier)(SemiColon))
}

qi::rule<Iterator, Skipper> Module;
qi::rule<Iterator> KeywordImport,KeywordAll,Identifier,SemiColon;
qi::rule<Iterator> Alpha,UpperAlpha,LowerAlpha,Underscore,Num,AlphaNum;
qi::rule<Iterator> NonZeroNum;
};

int main()
{
std::string const content = "import \r\n\r\nfoobar\r\n\r\n all; bogus";

pos_iterator_t first(content.begin()), iter=first, last(content.end());

ParseGrammar<pos_iterator_t> resolver;    //  Our parser
bool ok = phrase_parse(iter, last, resolver, qi::space);

std::cout << std::boolalpha;
std::cout << "\nok : " << ok << std::endl;
std::cout << "full   : " << (iter == last) << std::endl;

if(ok && iter==last)
{
std::cout << "OK: Parsing fully succeeded\n\n";
}
else
{
int line   = get_line(iter);
int column = get_column(first, iter);
std::cout << "-------------------------\n";
std::cout << "ERROR: Parsing failed or not complete\n";
std::cout << "stopped at: " << line  << ":" << column << "\n";
std::cout << "remaining: '" << std::string(iter, last) << "'\n";
std::cout << "-------------------------\n";
}
return 0;
}

Я добавил немного «фальшивых» в конце ввода, чтобы вывод стал более приятной демонстрацией:

<Module>
<try>import \r\n\r\nfoobar\r\n\r</try>
<KeywordImport>
<try>import \r\n\r\nfoobar\r\n\r</try>
<success> \r\n\r\nfoobar\r\n\r\n all;</success>
<attributes>[]</attributes>
</KeywordImport>
<Identifier>
<try>foobar\r\n\r\n all; bogu</try>
<success>\r\n\r\n all; bogus</success>
<attributes>[]</attributes>
</Identifier>
<KeywordAll>
<try>all; bogus</try>
<success>; bogus</success>
<attributes>[]</attributes>
</KeywordAll>
<SemiColon>
<try>; bogus</try>
<success> bogus</success>
<attributes>[]</attributes>
</SemiColon>
<success> bogus</success>
<attributes>[]</attributes>
</Module>

ok : true
full   : false
-------------------------
ERROR: Parsing failed or not complete
stopped at: 3:8
remaining: 'bogus'
-------------------------

Тем не менее, это то, что я, вероятно, сократил бы это до:

template <typename Iterator, typename Skipper = qi::space_type>
struct ParseGrammar: public qi::grammar<Iterator, Skipper>
{
ParseGrammar() : ParseGrammar::base_type(Module)
{
using namespace qi;

Identifier = alpha >> *(alnum | '_');
Module     = "import" >> Identifier >> "all" >> ';';

BOOST_SPIRIT_DEBUG_NODES((Module)(Identifier))
}

qi::rule<Iterator, Skipper> Module;
qi::rule<Iterator> Identifier;
};

Как видите, Identifier правило подразумевается лексема потому что не заявлено использовать шкипер.

Видеть это Жить на Колиру

1