JAXB 取消编组忽略命名空间会将元素属性转换为 null

2022-09-01 23:03:22

我正在尝试使用 JAXB 将 xml 文件解构为对象,但遇到了一些困难。实际项目在xml文件中有几千行,因此我以较小的规模再现了错误,如下所示:

XML 文件:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<catalogue title="some catalogue title" 
           publisher="some publishing house" 
           xmlns="x-schema:TamsDataSchema.xml"/>

用于生成 JAXB 类的 XSD 文件

<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
 <xsd:element name="catalogue" type="catalogueType"/>

 <xsd:complexType name="catalogueType">
  <xsd:sequence>
   <xsd:element ref="journal"  minOccurs="0" maxOccurs="unbounded"/>
  </xsd:sequence>
  <xsd:attribute name="title" type="xsd:string"/>
  <xsd:attribute name="publisher" type="xsd:string"/>
 </xsd:complexType>
</xsd:schema>

代码片段 1:

final JAXBContext context = JAXBContext.newInstance(CatalogueType.class);
um = context.createUnmarshaller();
CatalogueType ct = (CatalogueType)um.unmarshal(new File("file output address"));

这会引发错误:

javax.xml.bind.UnmarshalException: unexpected element (uri:"x-schema:TamsDataSchema.xml", local:"catalogue"). Expected elements are <{}catalogue>
 at com.sun.xml.bind.v2.runtime.unmarshaller.UnmarshallingContext.handleEvent(UnmarshallingContext.java:642)
 at com.sun.xml.bind.v2.runtime.unmarshaller.Loader.reportError(Loader.java:247)
 at com.sun.xml.bind.v2.runtime.unmarshaller.Loader.reportError(Loader.java:242)
 at com.sun.xml.bind.v2.runtime.unmarshaller.Loader.reportUnexpectedChildElement(Loader.java:116)
 at com.sun.xml.bind.v2.runtime.unmarshaller.UnmarshallingContext$DefaultRootLoader.childElement(UnmarshallingContext.java:1049)
 at com.sun.xml.bind.v2.runtime.unmarshaller.UnmarshallingContext._startElement(UnmarshallingContext.java:478)
 at com.sun.xml.bind.v2.runtime.unmarshaller.UnmarshallingContext.startElement(UnmarshallingContext.java:459)
 at com.sun.xml.bind.v2.runtime.unmarshaller.SAXConnector.startElement(SAXConnector.java:148)
 at com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.startElement(Unknown Source)
 at com.sun.org.apache.xerces.internal.parsers.AbstractXMLDocumentParser.emptyElement(Unknown Source)
 at com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl.scanStartElement(Unknown Source)
 at com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl$NSContentDispatcher.scanRootElementHook(Unknown Source)
 at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDispatcher.dispatch(Unknown Source)
 at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
 at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
 at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
 at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
    ...etc

因此,XML文档中的命名空间会导致问题,不幸的是,如果它被删除,它可以正常工作,但是由于文件是由客户端提供的,因此我们陷入了困境。我已经尝试了许多在XSD中指定它的方法,但似乎没有一个排列有效。

我还尝试使用以下代码取消元帅忽略命名空间:

Unmarshaller um = context.createUnmarshaller();
final SAXParserFactory sax = SAXParserFactory.newInstance();
sax.setNamespaceAware(false);
final XMLReader reader = sax.newSAXParser().getXMLReader();
final Source er = new SAXSource(reader, new InputSource(new FileReader("file location")));
CatalogueType ct = (CatalogueType)um.unmarshal(er);
System.out.println(ct.getPublisher());
System.out.println(ct.getTitle());

它工作正常,但无法取消元帅元素属性和打印

null
null

由于我们无法控制的原因,我们仅限于使用Java 1.5,我们使用JAXB 2.0,这很不幸,因为第二个代码块在Java 1.6中按预期工作。

任何建议都将不胜感激,另一种方法是在解析之前将命名空间声明从文件中删除,这似乎不优雅。


答案 1

感谢您的这篇文章和您的代码片段。这绝对让我走上了正确的道路,因为我也在疯狂地试图处理一些供应商提供的XML,这些XML到处都是。xmlns="http://vendor.com/foo"

我的第一个解决方案(在我阅读你的帖子之前)是将XML放在一个字符串中,然后(恐怖,恐怖)。除了冒犯了我的感性之外,从 InputStream 处理 XML 时也很痛苦。xmlString.replaceAll(" xmlns=", " ylmns=");

我的第二个解决方案,在看了你的代码片段之后:(我使用的是Java7)

// given an InputStream inputStream:
String packageName = docClass.getPackage().getName();
JAXBContext jc = JAXBContext.newInstance(packageName);
Unmarshaller u = jc.createUnmarshaller();

InputSource is = new InputSource(inputStream);
final SAXParserFactory sax = SAXParserFactory.newInstance();
sax.setNamespaceAware(false);
final XMLReader reader;
try {
    reader = sax.newSAXParser().getXMLReader();
} catch (SAXException | ParserConfigurationException e) {
    throw new RuntimeException(e);
}
SAXSource source = new SAXSource(reader, is);
@SuppressWarnings("unchecked")
JAXBElement<T> doc = (JAXBElement<T>)u.unmarshal(source);
return doc.getValue();

但是现在,我发现了我更喜欢的第三个解决方案,希望它可能对其他人有用:如何在架构中正确定义预期的命名空间:

<xsd:schema jxb:version="2.0"
  xmlns:xsd="http://www.w3.org/2001/XMLSchema"
  xmlns:jxb="http://java.sun.com/xml/ns/jaxb"
  xmlns="http://vendor.com/foo"
  targetNamespace="http://vendor.com/foo"
  elementFormDefault="unqualified"
  attributeFormDefault="unqualified">

这样,我们现在可以删除该行(更新:实际上,如果我们保留调用,那么我们需要.但更简单的方法是不要打扰和围绕其创建的代码,而是默认为命名空间感知。而且 marshal() 的 ouput 也具有适当的命名空间。sax.setNamespaceAware(false);unmarshal(SAXSource)sax.setNamespaceAware(true)SAXSourceunmarshal(InputStream)

叶。只需大约4个小时。


答案 2

如何忽略命名空间

您可以使用非命名空间感知的,它基本上会从您正在解析的xml文件中修剪掉所有命名空间:XMLStreamReader

// configure the stream reader factory
XMLInputFactory xif = XMLInputFactory.newFactory();
xif.setProperty(XMLInputFactory.IS_NAMESPACE_AWARE, false); // this is the magic line

// create xml stream reader using our configured factory
StreamSource source = new StreamSource(someFile);
XMLStreamReader xsr = xif.createXMLStreamReader(source);

// unmarshall, note that it's better to reuse JAXBContext, as newInstance()
// calls are pretty expensive
JAXBContext jc = JAXBContext.newInstance(your.ObjectFactory.class);
Unmarshaller unmarshaller = jc.createUnmarshaller();
Object unmarshal = unmarshaller.unmarshal(xsr);

现在,输入 JAXB 的实际 xml 没有任何命名空间信息。


重要提示

如果您从模式中使用生成 java 类,并且该模式定义了命名空间,则生成的注释将具有该命名空间,因此请手动将其删除!否则,JAXB 将无法识别此类数据。xsdxjc

应更改批注的位置:

  • 对象工厂.java

     // change this line
     private final static QName _SomeType_QNAME = new QName("some-weird-namespace", "SomeType");
     // to something like
     private final static QName _SomeType_QNAME = new QName("", "SomeType", "");
    
     // and this annotation
     @XmlElementDecl(namespace = "some-weird-namespace", name = "SomeType")
     // to this
     @XmlElementDecl(namespace = "", name = "SomeType")
    
  • 包信息.java

     // change this annotation
     @javax.xml.bind.annotation.XmlSchema(namespace = "some-weird-namespace", elementFormDefault = javax.xml.bind.annotation.XmlNsForm.QUALIFIED)
     // to something like this
     @javax.xml.bind.annotation.XmlSchema(namespace = "", elementFormDefault = javax.xml.bind.annotation.XmlNsForm.QUALIFIED)
    

现在,您的 JAXB 代码将期望看到没有任何命名空间的所有内容,而我们创建的代码恰好提供了这一点。XMLStreamReader


推荐