Я использую C ++ и libtidy для анализа HTML-страницы. но документ для libtidy настолько неполон, что я не могу понять, что делают функции API. Я хочу получить определенное значение атрибута из узла html dom, например:
<table class="xxxx" ...
Я хочу получить «хххх». Как я могу это сделать? Должен ли я пройти через все атрибуты под узлом таблицы, как это?
if (tidyNodeIsTABLE(tdNode))
{
TidyAttr attr;
for (attr=tidyAttrFirst(tdNode); attr; attr=tidyAttrNext(attr))
{
if (tidyAttrGetId(attr) == TidyAttr_CLASS)
{
std::string value = tidyAttrValue(attr);
break;
}
}
}
или есть более удобный способ? Благодарю.
Задача ещё не решена.