如何解析无效(坏/格式不正确)的XML?
目前,我正在开发一项功能,该功能涉及解析我们从其他产品收到的XML。我决定对一些实际的客户数据运行一些测试,看起来其他产品允许用户输入应该被认为是无效的。无论如何,我仍然必须尝试找出一种方法来解析它。我们正在使用,但我在输入时收到一个错误,如下所示。javax.xml.parsers.DocumentBuilder
<xml>
...
<description>Example:Description:<THIS-IS-PART-OF-DESCRIPTION></description>
...
</xml>
如您所知,描述内部似乎有一个无效的标签()。现在,已知此描述标记是叶标记,并且其中不应包含任何嵌套标记。无论如何,这仍然是一个问题,并产生一个例外<THIS-IS-PART-OF-DESCRIPTION>
DocumentBuilder.parse(...)
我知道这是无效的XML,但它是可以预见的无效的。关于解析此类输入的方法的任何想法?