哪个是Java中XML解析的最佳库[已关闭]

2022-08-31 06:56:40

我正在搜索java库来解析XML(复杂的配置和数据文件),我用谷歌搜索了一下,但除了dom4j之外找不到(似乎他们正在开发V2)。我已经看过共享资源配置,但不喜欢它,XML上的其他apache项目似乎处于休眠状态。我自己还没有评估过dom4j,只是想知道 - java还有其他(好的)开源xml解析库吗?以及您对dom4j的体验如何?

在@Voo的答案之后,让我问另一个问题 - 我应该使用java的内置类还是像dom4j这样的任何第三方库。有哪些优势?


答案 1

实际上,Java支持4种方法来开箱即用地解析XML:

DOM解析器/构建器:整个XML结构加载到内存中,您可以使用众所周知的DOM方法来使用它。DOM 还允许您使用 Xslt 转换写入文档。例:

public static void parse() throws ParserConfigurationException, IOException, SAXException {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    factory.setValidating(true);
    factory.setIgnoringElementContentWhitespace(true);
    DocumentBuilder builder = factory.newDocumentBuilder();
    File file = new File("test.xml");
    Document doc = builder.parse(file);
    // Do something with the document here.
}

SAX 解析器:仅用于读取 XML 文档。Sax 解析器运行整个文档并调用用户的回调方法。有开始/结束文档,元素等的方法。它们是在 org.xml.sax.ContentHandler 中定义的,并且有一个空的帮助程序类 DefaultHandler。

public static void parse() throws ParserConfigurationException, SAXException {
    SAXParserFactory factory = SAXParserFactory.newInstance();
    factory.setValidating(true);
    SAXParser saxParser = factory.newSAXParser();
    File file = new File("test.xml");
    saxParser.parse(file, new ElementHandler());    // specify handler
}

StAx 读取器/写入器:这适用于面向数据流的接口。程序在准备就绪时会像光标/迭代器一样请求下一个元素。您还可以使用它创建文档。阅读文档:

public static void parse() throws XMLStreamException, IOException {
    try (FileInputStream fis = new FileInputStream("test.xml")) {
        XMLInputFactory xmlInFact = XMLInputFactory.newInstance();
        XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);
        while(reader.hasNext()) {
            reader.next(); // do something here
        }
    }
}

编写文档:

public static void parse() throws XMLStreamException, IOException {
    try (FileOutputStream fos = new FileOutputStream("test.xml")){
        XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();
        XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);
        writer.writeStartDocument();
        writer.writeStartElement("test");
        // write stuff
        writer.writeEndElement();
    }
}

JAXB:读取 XML 文档的最新实现:是 v2 中 Java 6 的一部分。这允许我们从文档中序列化java对象。您阅读的文档包含一个实现 javax..xml.bind.Unmarshaller 接口的类(您可以从 JAXBContext.newInstance 获得一个此类)。上下文必须使用使用的类进行初始化,但您只需要指定根类,而不必担心静态引用的类。您可以使用注释来指定哪些类应该是元素(@XmlRootElement),哪些字段是元素(@XmlElement)或属性(@XmlAttribute,真是惊喜!

public static void parse() throws JAXBException, IOException {
    try (FileInputStream adrFile = new FileInputStream("test")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Unmarshaller um = ctx.createUnmarshaller();
        RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile);
    }
}

编写文档:

public static void parse(RootElementClass out) throws IOException, JAXBException {
    try (FileOutputStream adrFile = new FileOutputStream("test.xml")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Marshaller ma = ctx.createMarshaller();
        ma.marshal(out, adrFile);
    }
}

例子无耻地从一些旧的讲座幻灯片中复制;-)

编辑:关于“我应该使用哪个API?嗯,这取决于 - 并非所有API都具有与您看到的相同的功能,但是如果您能够控制用于映射XML文档的类,JAXB是我个人最喜欢的,非常优雅和简单的解决方案(尽管我没有将其用于非常大的文档,它可能会变得有点复杂)。SAX也非常易于使用,如果你没有一个很好的理由使用它,请远离DOM - 在我看来,旧的,笨拙的API。我不认为有任何现代第三方库具有STL中缺少的特别有用的东西,标准库具有通常的优势,即经过了非常好的测试,记录和稳定。


答案 2

Java 支持两种开箱即用的 XML 解析方法。

SAXParser

如果要解析大型 XML 文件和/或不想使用大量内存,则可以使用此解析器。

http://download.oracle.com/javase/6/docs/api/javax/xml/parsers/SAXParserFactory.html

示例:http://www.mkyong.com/java/how-to-read-xml-file-in-java-sax-parser/

DOMParser

如果您需要执行 XPath 查询或需要提供完整的 DOM,则可以使用此解析器。

http://download.oracle.com/javase/6/docs/api/javax/xml/parsers/DocumentBuilderFactory.html

示例:http://www.mkyong.com/java/how-to-read-xml-file-in-java-dom-parser/


推荐