如何在Java中使用AVRO序列化日期

2022-09-03 00:00:15

我实际上正在尝试使用Avro序列化包含日期的对象,并且反序列化的日期与预期值不匹配(使用avro 1.7.2和1.7.1进行测试)。以下是我正在序列化的类:

import java.text.SimpleDateFormat;
import java.util.Date;

public class Dummy {
    private Date date;
    private SimpleDateFormat df = new SimpleDateFormat("dd/MM/yyyy hh:mm:ss.SSS");

    public Dummy() {
    }

    public void setDate(Date date) {
        this.date = date;
    }

    public Date getDate() {
        return date;
    }

    @Override
    public String toString() {
        return df.format(date);
    }
}

用于序列化/反序列化的代码:

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.util.Date;

import org.apache.avro.Schema;
import org.apache.avro.io.DatumReader;
import org.apache.avro.io.DatumWriter;
import org.apache.avro.io.Decoder;
import org.apache.avro.io.DecoderFactory;
import org.apache.avro.io.Encoder;
import org.apache.avro.io.EncoderFactory;
import org.apache.avro.reflect.ReflectData;
import org.apache.avro.reflect.ReflectDatumReader;
import org.apache.avro.reflect.ReflectDatumWriter;

public class AvroSerialization {

    public static void main(String[] args) {
        Dummy expected = new Dummy();
        expected.setDate(new Date());
        System.out.println("EXPECTED: " + expected);
        Schema schema = ReflectData.get().getSchema(Dummy.class);
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        Encoder encoder = EncoderFactory.get().binaryEncoder(baos, null);
        DatumWriter<Dummy> writer = new ReflectDatumWriter<Dummy>(schema);
        try {
            writer.write(expected, encoder);
            encoder.flush();
            Decoder decoder = DecoderFactory.get().binaryDecoder(baos.toByteArray(), null);
            DatumReader<Dummy> reader = new ReflectDatumReader<Dummy>(schema);
            Dummy actual = reader.read(null, decoder);
            System.out.println("ACTUAL: " + actual);
        } catch (IOException e) {
            System.err.println("IOException: " + e.getMessage());
        }
    }
}

输出:

EXPECTED: 06/11/2012 05:43:29.188
ACTUAL: 06/11/2012 05:43:29.387

它是否与已知错误有关,或者是否与我序列化对象的方式有关?


答案 1

Avro 1.8 现在有一个日期“logicalType”,它注释了 int。例如:

{“name”: “date”, “type”: “int”, “logicalType”: “date”}

引用规范:“日期逻辑类型注释 Avro int,其中 int 存储来自 unix 纪元(1970 年 1 月 1 日(ISO 日历)的天数。


答案 2

我认为AVRO在这一点上没有序列化日期。我要做的是将它包装在另一个类中,并存储为长(date.gettime()),而avro人则添加此功能。您看到不同 Date 值的原因是,每次您(和 avro)创建 Date 对象时,它都会使用当前系统时间初始化 Date。