从 xml 中删除非 UTF-8 字符,并声明编码 =utf-8 - Java
我必须在Java中处理这种情况:
我从声明编码=utf-8的客户端收到XML格式的请求。不幸的是,它可能不包含utf-8字符,并且需要从我这边的xml中删除这些字符(旧版)。
让我们考虑一个示例,其中此无效的 XML 包含 £ (磅)。
1)我得到xml作为java字符串,其中有£(我现在没有访问接口,但我可能得到xml作为java字符串)。我可以使用 replaceAll(£, “”) 来摆脱这个字符吗?是否有任何潜在问题?
2)我得到xml作为字节数组 - 在这种情况下,如何安全地处理此操作?