如何在Java中添加UTF-8 BOM?

我有一个Java存储过程,它使用对象从表中提取记录并创建CS Vfile。Resultset

BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);

ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('\ufeff');
out.flush();

zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
    out.print("\"" + rs.getString(i) + "\"");
    out.print(",");
}
out.flush();

zipOut.closeEntry();
zipOut.close();
retBLOB.close();

return retBLOB;

但生成的 CSV 文件未显示正确的德语字符。Oracle 数据库的值也为 UTF8。NLS_CHARACTERSET

请建议。


答案 1
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);

这会正确地将0xEF 0xBB 0xBF写出到文件中,该文件是 BOM 表的 UTF-8 表示形式。


答案 2

以防万一人们使用s,你需要以不同的方式做。虽然 a 会做一些魔术将单个字节转换为 3 个字节,但 a 需要单独使用 UTF-8 BOM 的所有 3 个字节:PrintStreamWriterPrintStream

    // Print utf-8 BOM
    PrintStream out = System.out;
    out.write('\ufeef'); // emits 0xef
    out.write('\ufebb'); // emits 0xbb
    out.write('\ufebf'); // emits 0xbf

或者,您可以直接对以下各项使用十六进制值:

    PrintStream out = System.out;
    out.write(0xef); // emits 0xef
    out.write(0xbb); // emits 0xbb
    out.write(0xbf); // emits 0xbf

推荐