Подтвердить что ты не робот

По умолчанию пространство имен XML, JDOM и XPath

Я хочу использовать JDOM для чтения в XML файле, а затем использовать XPath для извлечения данных из документа JDOM. Он создает объект Document fine, но когда я использую XPath для запроса документа для списка элементов, я ничего не получаю.

Мой XML-документ имеет пространство имен по умолчанию, определенное в корневом элементе. Самое смешное, когда я удаляю пространство имен по умолчанию, он успешно запускает запрос XPath и возвращает те элементы, которые я хочу. Что еще я должен сделать, чтобы получить запрос XPath для получения результатов?

XML:

<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.foo.com">
<dvd id="A">
  <title>Lord of the Rings: The Fellowship of the Ring</title>
  <length>178</length>
  <actor>Ian Holm</actor>
  <actor>Elijah Wood</actor>
  <actor>Ian McKellen</actor>
</dvd>
<dvd id="B">
  <title>The Matrix</title>
  <length>136</length>
  <actor>Keanu Reeves</actor>
  <actor>Laurence Fishburne</actor>
</dvd>
</collection>

Java:

public static void main(String args[]) throws Exception {
    SAXBuilder builder = new SAXBuilder();
    Document d = builder.build("xpath.xml");
    XPath xpath = XPath.newInstance("collection/dvd");
    xpath.addNamespace(d.getRootElement().getNamespace());
    System.out.println(xpath.selectNodes(d));
}
4b9b3361

Ответ 1

XPath 1.0 не поддерживает концепцию пространства имен по умолчанию (XPath 2.0).  Любой нефиксированный тег всегда считается частью пространства имен без имени.

При использовании XPath 1.0 вам нужно что-то вроде этого:

public static void main(String args[]) throws Exception {
    SAXBuilder builder = new SAXBuilder();
    Document d = builder.build("xpath.xml");
    XPath xpath = XPath.newInstance("x:collection/x:dvd");
    xpath.addNamespace("x", d.getRootElement().getNamespaceURI());
    System.out.println(xpath.selectNodes(d));
}

Ответ 2

У меня была аналогичная проблема, но мой был тем, что у меня была смесь XML-входов, некоторые из которых имели пространство имен, а другие - нет. Чтобы упростить мою проблему, я загрузил следующий фрагмент JDOM после загрузки документа.

for (Element el : doc.getRootElement().getDescendants(new ElementFilter())) {
    if (el.getNamespace() != null) el.setNamespace(null);
}

После удаления всех пространств имен я смог использовать простую навигацию по стилю getChild ( "elname" ) или простые запросы XPath.

Я бы не рекомендовал эту технику как общее решение, но в моем случае это было определенно полезно.

Ответ 3

Вы также можете сделать следующее

/*[local-name() = 'collection']/*[local-name() = 'dvd']/

Здесь - список полезных запросов xpath.