Подтвердить что ты не робот

Анализ атрибутов XML с помощью Boost

Я хотел бы поделиться с вами вопросом, который у меня возникает, пытаясь обработать некоторые атрибуты из XML-элементов на С++ с помощью библиотек Boost (версия 1.52.0). Учитывая следующий код:

#define ATTR_SET ".<xmlattr>"
#define XML_PATH1 "./pets.xml"

#include <iostream>
#include <string>
#include <boost/foreach.hpp>
#include <boost/property_tree/ptree.hpp>
#include <boost/property_tree/xml_parser.hpp>

using namespace std;
using namespace boost;
using namespace boost::property_tree;

const ptree& empty_ptree(){
    static ptree t;
    return t;

int main() {
    ptree tree;
    read_xml(XML_PATH1, tree);
    const ptree & formats = tree.get_child("pets", empty_ptree());
    BOOST_FOREACH(const ptree::value_type & f, formats){
        string at = f.first + ATTR_SET;
        const ptree & attributes = formats.get_child(at, empty_ptree());
        cout << "Extracting attributes from " << at << ":" << endl;
        BOOST_FOREACH(const ptree::value_type &v, attributes){
            cout << "First: " << v.first.data() << " Second: " << v.second.data() << endl;

Скажем, у меня есть следующая структура XML:

<?xml version="1.0" encoding="utf-8"?>
    <cat name="Garfield" weight="4Kg">
    <dog name="Milu" weight="7Kg">
    <bird name="Tweety" weight="0.1Kg">

Поэтому выход консоли, который я получу, будет следующим:

Extracting attributes from cat.<xmlattr>:
First: name Second: Garfield
First: weight Second: 4Kg
Extracting attributes from dog.<xmlattr>:
First: name Second: Milu
First: weight Second: 7Kg
Extracting attributes from bird.<xmlattr>:
First: name Second: Tweety
First: weight Second: 0.1Kg

Однако, если я решил использовать общую структуру для каждого элемента, лежащего из корня node (чтобы идентифицировать их по их конкретным атрибутам), результат полностью изменится. Это может быть XML файл в таком случае:

<?xml version="1.0" encoding="utf-8"?>
    <pet type="cat" name="Garfield" weight="4Kg">
    <pet type="dog" name="Milu" weight="7Kg">
    <pet type="bird" name="Tweety" weight="0.1Kg">

И выход будет следующим:

Extracting attributes from pet.<xmlattr>:
First: type Second: cat
First: name Second: Garfield
First: weight Second: 4Kg
Extracting attributes from pet.<xmlattr>:
First: type Second: cat
First: name Second: Garfield
First: weight Second: 4Kg
Extracting attributes from pet.<xmlattr>:
First: type Second: cat
First: name Second: Garfield
First: weight Second: 4Kg

Кажется, что количество элементов, зависающих от корня node, распознается должным образом, поскольку были напечатаны три набора атрибутов. Тем не менее, все они относятся к атрибутам самого первого элемента...

Я не эксперт в С++ и действительно новичок в Boost, так что это может быть что-то, чего я не вижу в отношении обработки хеш-карт или так... Любые советы будут очень оценены.


Ответ 1

Проблема с вашей программой находится в этой строке:

const ptree & attributes = formats.get_child(at, empty_ptree());

С помощью этой строки вы запрашиваете ребенка pet.<xmlattr> из pets, и вы делаете это 3 раза независимо от того, что вы проходите f. Следуя этой статье, я бы предположил, что вам нужно использовать:

const ptree & attributes = f.second.get_child("<xmlattr>", empty_ptree());

Полный код, который работает с вашими xml файлами, это:

#define ATTR_SET ".<xmlattr>"
#define XML_PATH1 "./pets.xml"

#include <iostream>
#include <string>
#include <boost/foreach.hpp>
#include <boost/property_tree/ptree.hpp>
#include <boost/property_tree/xml_parser.hpp>

using namespace std;
using namespace boost;
using namespace boost::property_tree;

const ptree& empty_ptree(){
    static ptree t;
    return t;

int main() {
    ptree tree;
    read_xml(XML_PATH1, tree);
    const ptree & formats = tree.get_child("pets", empty_ptree());
    BOOST_FOREACH(const ptree::value_type & f, formats){
        string at = f.first + ATTR_SET;
        const ptree & attributes = f.second.get_child("<xmlattr>", empty_ptree());
        cout << "Extracting attributes from " << at << ":" << endl;
        BOOST_FOREACH(const ptree::value_type &v, attributes){
            cout << "First: " << v.first.data() << " Second: " << v.second.data() << endl;

Ответ 2

Без использования этой возможности до сих пор я подозревал, что парсер XML boost::property_tree не является общим парсером XML, но ожидает определенную схему, где у вас есть только один конкретный тег для одного конкретного свойства.

Возможно, вы захотите использовать другие синтаксические анализаторы XML, которые обеспечивают синтаксический анализ любой схемы XML, если вы хотите работать с XML за пределами возможностей boost::property_tree. Посмотрите, например. Xerces С++ или Poco XML.

Ответ 3

Файл для анализа, pets.xml

    <pet type="cat" name="Garfield" weight="4Kg">
        <something name="test" value="*"/>
         <something name="demo" value="@"/>
    <pet type="dog" name="Milu" weight="7Kg">
         <something name="test1" value="$"/>
    <birds type="parrot">
        <bird name="african grey parrot"/>
        <bird name="amazon parrot"/>


// DemoPropertyTree.cpp : Defines the entry point for the console application.
//Prerequisite boost library

#include "stdafx.h"
#include <boost/property_tree/xml_parser.hpp>
#include <boost/property_tree/ptree.hpp>
#include <boost/foreach.hpp>
using namespace std;
using namespace boost;
using namespace boost::property_tree;

void processPet(ptree subtree)
    BOOST_FOREACH(ptree::value_type petChild,subtree.get_child(""))
        //processing attributes of element pet
            BOOST_FOREACH(ptree::value_type petAttr,petChild.second.get_child(""))
        //processing child element of pet(something)
        else if(petChild.first=="something")
            BOOST_FOREACH(ptree::value_type somethingChild,petChild.second.get_child(""))
                //processing attributes of element something
                    BOOST_FOREACH(ptree::value_type somethingAttr,somethingChild.second.get_child(""))
void processBirds(ptree subtree)
    BOOST_FOREACH(ptree::value_type birdsChild,subtree.get_child(""))
        //processing attributes of element birds
            BOOST_FOREACH(ptree::value_type birdsAttr,birdsChild.second.get_child(""))
        //processing child element of birds(bird)
        else if(birdsChild.first=="bird")
            BOOST_FOREACH(ptree::value_type birdChild,birdsChild.second.get_child(""))
                //processing attributes of element bird
                    BOOST_FOREACH(ptree::value_type birdAttr,birdChild.second.get_child(""))
int _tmain(int argc, _TCHAR* argv[])

    const std::string XML_PATH1 = "C:/Users/10871/Desktop/pets.xml";
    ptree pt1;
    boost::property_tree::read_xml( XML_PATH1, pt1  );
    BOOST_FOREACH( ptree::value_type const& topNodeChild, pt1.get_child( "pets" ) ) 
        ptree subtree = topNodeChild.second;
        if( topNodeChild.first == "pet" ) 
        else if(topNodeChild.first=="birds")

    return 0;

Вывод показан здесь: вывод