如何在独立的java代码中读取镶木地板文件?[已关闭]

2022-09-02 01:47:49

来自cloudera的镶木地板文档显示了与猪/蜂巢/黑斑羚集成的示例。但在许多情况下,我想读取镶木地板文件本身以进行调试。

有没有一个简单的java阅读器API来读取镶木地板文件?

谢谢杨


答案 1

旧方法:(已弃用)

AvroParquetReader<GenericRecord> reader = new AvroParquetReader<GenericRecord>(file);
GenericRecord nextRecord = reader.read();

新方法:

ParquetReader<GenericRecord> reader = AvroParquetReader.<GenericRecord>builder(file).build();
GenericRecord nextRecord = reader.read();

从这里得到了这个,并成功地在我的测试用例中使用它。


答案 2

您可以使用 Parquet-avro 库中将 Parquet 文件作为一组 AVRO 对象进行读取。AvroParquetReaderGenericRecord


推荐