org.xml.sax.SAXParseException: prolog 中不允许包含内容

2022-08-31 06:22:50

我有一个基于Java的Web服务客户端连接到Java Web服务(在Axis1框架上实现)。

我在日志文件中遇到以下异常:

Caused by: org.xml.sax.SAXParseException: Content is not allowed in prolog.
    at org.apache.xerces.util.ErrorHandlerWrapper.createSAXParseException(Unknown Source)
    at org.apache.xerces.util.ErrorHandlerWrapper.fatalError(Unknown Source)
    at org.apache.xerces.impl.XMLErrorReporter.reportError(Unknown Source)
    at org.apache.xerces.impl.XMLErrorReporter.reportError(Unknown Source)
    at org.apache.xerces.impl.XMLScanner.reportFatalError(Unknown Source)
    at org.apache.xerces.impl.XMLDocumentScannerImpl$PrologDispatcher.dispatch(Unknown Source)
    at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
    at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source)
    at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source)
    at org.apache.xerces.parsers.XMLParser.parse(Unknown Source)
    at org.apache.xerces.parsers.AbstractSAXParser.parse(Unknown Source)
    at javax.xml.parsers.SAXParser.parse(Unknown Source)
    at org.apache.axis.encoding.DeserializationContext.parse(DeserializationContext.java:227)
    at org.apache.axis.SOAPPart.getAsSOAPEnvelope(SOAPPart.java:696)
    at org.apache.axis.Message.getSOAPEnvelope(Message.java:435)
    at org.apache.ws.axis.security.WSDoAllReceiver.invoke(WSDoAllReceiver.java:114)
    at org.apache.axis.strategies.InvocationStrategy.visit(InvocationStrategy.java:32)
    at org.apache.axis.SimpleChain.doVisiting(SimpleChain.java:118)
    at org.apache.axis.SimpleChain.invoke(SimpleChain.java:83)
    at org.apache.axis.client.AxisClient.invoke(AxisClient.java:198)
    at org.apache.axis.client.Call.invokeEngine(Call.java:2784)
    at org.apache.axis.client.Call.invoke(Call.java:2767)
    at org.apache.axis.client.Call.invoke(Call.java:2443)
    at org.apache.axis.client.Call.invoke(Call.java:2366)
    at org.apache.axis.client.Call.invoke(Call.java:1812)

答案 1

这通常是由 XML 声明前的空格引起的,但它可以是任何文本,如短划线或任何字符。我说经常由空白引起,因为人们认为空白总是可以忽略的,但这里的情况并非如此。


经常发生的另一件事是 UTF-8 BOM(字节顺序标记),如果将文档作为字符流传递给 XML 解析器而不是字节流,则在将 XML 声明视为空格之前,允许使用该标记。

如果使用架构文件 (.xsd) 来验证 xml 文件,并且其中一个架构文件具有 UTF-8 BOM,则也会发生同样的情况。


答案 2

实际上除了尤里·祖巴列夫的帖子

当您将不存在的 xml 文件传递给解析器时。例如,您通过

new File("C:/temp/abc")

当文件系统上仅存在 C:/temp/abc.xml 文件时

在任何一种情况下

builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
document = builder.parse(new File("C:/temp/abc"));

DOMParser parser = new DOMParser();
parser.parse("file:C:/temp/abc");

都给出相同的错误消息。

非常令人失望的错误,因为以下跟踪

javax.servlet.ServletException
    at org.apache.xerces.parsers.DOMParser.parse(Unknown Source)
...
Caused by: org.xml.sax.SAXParseException: Content is not allowed in prolog.
... 40 more

没有说任何关于“文件名不正确”或“这样的文件不存在”的事实。在我的情况下,我有绝对正确的xml文件,不得不花2天时间确定真正的问题。


推荐