默认 XML 命名空间、JDOM 和 XPath

xpath java xml jdom

2022-09-04 06:18:14

我想使用 JDOM 读取 XML 文件，然后使用 XPath 从 JDOM 文档中提取数据。它可以很好地创建 Document 对象，但是当我使用 XPath 查询 Document 以获取元素列表时，我什么也得不到。

我的 XML 文档具有在根元素中定义的默认命名空间。有趣的是，当我删除默认命名空间时，它成功运行XPath查询并返回我想要的元素。我还必须执行哪些操作才能使 XPath 查询返回结果？

XML：

<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.foo.com">
<dvd id="A">
  <title>Lord of the Rings: The Fellowship of the Ring</title>
  <length>178</length>
  <actor>Ian Holm</actor>
  <actor>Elijah Wood</actor>
  <actor>Ian McKellen</actor>
</dvd>
<dvd id="B">
  <title>The Matrix</title>
  <length>136</length>
  <actor>Keanu Reeves</actor>
  <actor>Laurence Fishburne</actor>
</dvd>
</collection>

爪哇岛：

public static void main(String args[]) throws Exception {
    SAXBuilder builder = new SAXBuilder();
    Document d = builder.build("xpath.xml");
    XPath xpath = XPath.newInstance("collection/dvd");
    xpath.addNamespace(d.getRootElement().getNamespace());
    System.out.println(xpath.selectNodes(d));
}

答案 1

XPath 1.0 不支持默认命名空间的概念（XPath 2.0 支持）。任何不带前缀的标记始终假定为无名称命名空间的一部分。

使用 XPath 1.0 时，您需要类似如下的内容：

public static void main(String args[]) throws Exception {
    SAXBuilder builder = new SAXBuilder();
    Document d = builder.build("xpath.xml");
    XPath xpath = XPath.newInstance("x:collection/x:dvd");
    xpath.addNamespace("x", d.getRootElement().getNamespaceURI());
    System.out.println(xpath.selectNodes(d));
}

答案 2

我遇到了类似的问题，但我的问题是我有XML输入的混合，其中一些定义了命名空间，而另一些则没有。为了简化我的问题，我在加载文档后运行了以下JDOM代码段。

for (Element el : doc.getRootElement().getDescendants(new ElementFilter())) {
    if (el.getNamespace() != null) el.setNamespace(null);
}

删除所有命名空间后，我能够使用简单的getChild（“elname”）样式导航或简单的XPath查询。

我不会推荐这种技术作为一般解决方案，但在我的情况下，它绝对有用。