Java XPath(Apache JAXP 实现)性能
注意:如果您也遇到此问题,请在 Apache JIRA 上投赞成票:
我得出了一个惊人的结论::
Element e = (Element) document.getElementsByTagName("SomeElementName").item(0);
String result = ((Element) e).getTextContent();
似乎比这快了100倍:
// Accounts for 30%, can be cached
XPathFactory factory = XPathFactory.newInstance();
// Negligible
XPath xpath = factory.newXPath();
// Negligible
XPathExpression expression = xpath.compile("//SomeElementName");
// Accounts for 70%
String result = (String) expression.evaluate(document, XPathConstants.STRING);
我正在使用JVM的默认JAXP实现:
org.apache.xpath.jaxp.XPathFactoryImpl
org.apache.xpath.jaxp.XPathImpl
我真的很困惑,因为很容易看出JAXP如何优化上面的XPath查询以实际执行一个简单的查询。但它似乎没有这样做。此问题仅限于大约 5-6 个常用的 XPath 调用,这些调用由 API 抽象和隐藏。这些查询仅涉及针对始终可用的 DOM 文档的简单路径(例如,没有变量、条件)。因此,如果可以进行优化,则很容易实现。getElementsByTagName()
/a/b/c
我的问题是:XPath的缓慢是一个公认的事实,还是我忽略了什么?是否有更好(更快)的实施?或者我应该完全避免XPath,用于简单的查询?