损坏的文件处理
2022-09-01 07:04:26
我想知道是否有人对使用Apache POI处理损坏的文件有任何建议
我正在尝试打开文件,并收到以下消息:
Exception in thread "main" org.apache.poi.hssf.record.RecordInputStream$LeftoverDataException: Initialisation of record 0x1C left 2 bytes remaining still to be read.
at org.apache.poi.hssf.record.RecordInputStream.hasNextRecord(RecordInputStream.java:156)
at org.apache.poi.hssf.record.RecordFactoryInputStream.nextRecord(RecordFactoryInputStream.java:231)
at org.apache.poi.hssf.record.RecordFactory.createRecords(RecordFactory.java:480)
at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:301)
at org.apache.poi.ss.usermodel.WorkbookFactory.create(WorkbookFactory.java:95)
at ExcelImporter.EditFileImportDialog.main(EditFileImportDialog.java:409)
这是一个SSCCE
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;
public class EditFileImportDialog {
/* Omitted irrelevent code */
public static void main(String[] args) {
File file = new File("Z:\\Path\\To\\File_causing_the_trouble.xls");
try {
Workbook wb = WorkbookFactory.create(file); // Line 409 for ref to the exception stack trace
System.out.println(wb);
} catch (InvalidFormatException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
这只发生在这个文件上,如果我在excel中打开文件并保存它,然后尝试用.关于我如何处理这个问题的任何建议?POI
编辑:
请注意,我的问题可能与此问题有关,但升级并未解决我的问题,并且与所描述的文件存在差异。我已经搜索了类似的答案,但也许如果有人知道excel文件本身出了什么问题,我可以写一些东西来修补文件。POI
编辑 2
文件创建不在我的控制之下。Excel仅在打开并重新保存文件时修复文件本身。我的问题是,是否有人可以想到一种方法来调整/增强POI,以处理此损坏的文件,就像Excel能够解决问题一样。
编辑 3
针对一些评论/答案:
我的最终目标是根本不使用excel。
- 文件已发送。
- 程序运行。
- 处理错误。
- 处理数据。