POJOを一般的な方法でavroオブジェクトに変換する方法を探しています。実装は、POJOクラスの変更に対して堅牢でなければなりません。私はそれを達成しましたが、avroレコードを明示的に入力します(以下の例を参照)。
ハードコードされたフィールド名を削除して、オブジェクトからavroレコードを入力する方法はありますか?リフレクションが唯一の方法ですか、それともAvroはそのままでこの機能を提供しますか?
import Java.util.Date;
import Java.util.HashMap;
import Java.util.Map;
import org.Apache.avro.Schema;
import org.Apache.avro.generic.GenericData.Record;
import org.Apache.avro.reflect.ReflectData;
public class PojoToAvroExample {
static class PojoParent {
public final Map<String, String> aMap = new HashMap<String, String>();
public final Map<String, Integer> anotherMap = new HashMap<String, Integer>();
}
static class Pojo extends PojoParent {
public String uid;
public Date eventTime;
}
static Pojo createPojo() {
Pojo foo = new Pojo();
foo.uid = "123";
foo.eventTime = new Date();
foo.aMap.put("key", "val");
foo.anotherMap.put("key", 42);
return foo;
}
public static void main(String[] args) {
// extract the avro schema corresponding to Pojo class
Schema schema = ReflectData.get().getSchema(Pojo.class);
System.out.println("extracted avro schema: " + schema);
// create avro record corresponding to schema
Record avroRecord = new Record(schema);
System.out.println("corresponding empty avro record: " + avroRecord);
Pojo foo = createPojo();
// TODO: to be replaced by generic variant:
// something like avroRecord.importValuesFrom(foo);
avroRecord.put("uid", foo.uid);
avroRecord.put("eventTime", foo.eventTime);
avroRecord.put("aMap", foo.aMap);
avroRecord.put("anotherMap", foo.anotherMap);
System.out.println("expected avro record: " + avroRecord);
}
}
Springを使用していますか?
Spring機能を使用して、そのためのマッパーを作成します。ただし、生のリフレクションユーティリティを使用して、このようなマッパーを構築することもできます。
import org.Apache.avro.Schema;
import org.Apache.avro.generic.GenericData;
import org.Apache.avro.reflect.ReflectData;
import org.springframework.beans.PropertyAccessorFactory;
import org.springframework.util.Assert;
public class GenericRecordMapper {
public static GenericData.Record mapObjectToRecord(Object object) {
Assert.notNull(object, "object must not be null");
final Schema schema = ReflectData.get().getSchema(object.getClass());
final GenericData.Record record = new GenericData.Record(schema);
schema.getFields().forEach(r -> record.put(r.name(), PropertyAccessorFactory.forDirectFieldAccess(object).getPropertyValue(r.name())));
return record;
}
public static <T> T mapRecordToObject(GenericData.Record record, T object) {
Assert.notNull(record, "record must not be null");
Assert.notNull(object, "object must not be null");
final Schema schema = ReflectData.get().getSchema(object.getClass());
Assert.isTrue(schema.getFields().equals(record.getSchema().getFields()), "Schema fields didn't match");
record.getSchema().getFields().forEach(d -> PropertyAccessorFactory.forDirectFieldAccess(object).setPropertyValue(d.name(), record.get(d.name()) == null ? record.get(d.name()) : record.get(d.name()).toString()));
return object;
}
}
このマッパーを使用すると、avroに簡単にシリアル化できるGenericData.Recordを生成できます。 Avro ByteArrayを逆シリアル化すると、それを使用して、逆シリアル化されたレコードからPOJOを再構築できます。
シリアライズ
byte[] serialized = avroSerializer.serialize("topic", GenericRecordMapper.mapObjectToRecord(yourPojo));
逆シリアル化
GenericData.Record deserialized = (GenericData.Record) avroDeserializer.deserialize("topic", serialized);
YourPojo yourPojo = GenericRecordMapper.mapRecordToObject(deserialized, new YourPojo());
ここに変換する一般的な方法があります
public static <V> byte[] toBytesGeneric(final V v, final Class<V> cls) {
final ByteArrayOutputStream bout = new ByteArrayOutputStream();
final Schema schema = ReflectData.get().getSchema(cls);
final DatumWriter<V> writer = new ReflectDatumWriter<V>(schema);
final BinaryEncoder binEncoder = EncoderFactory.get().binaryEncoder(bout, null);
try {
writer.write(v, binEncoder);
binEncoder.flush();
} catch (final Exception e) {
throw new RuntimeException(e);
}
return bout.toByteArray();
}
public static void main(String[] args) {
PojoClass pojoObject = new PojoClass();
toBytesGeneric(pojoObject, PojoClass.class);
}
jackson/avro を使用すると、jackson/jsonと同様にpojoをbyte []に変換するのが非常に簡単になります。
byte[] avroData = avroMapper.writer(schema).writeValueAsBytes(pojo);
pS.
jacksonは、JSONだけでなく、XML/Avro/Protobuf/YAMLなども非常によく似たクラスとAPIで処理します。
@TranceMasterへの私のコメントに加えて、以下の修正バージョンは、プリミティブ型とJavaセットで機能します。
import org.Apache.avro.Schema;
import org.Apache.avro.generic.GenericData;
import org.Apache.avro.reflect.ReflectData;
import org.springframework.beans.PropertyAccessorFactory;
import org.springframework.util.Assert;
public class GenericRecordMapper {
public static GenericData.Record mapObjectToRecord(Object object) {
Assert.notNull(object, "object must not be null");
final Schema schema = ReflectData.get().getSchema(object.getClass());
System.out.println(schema);
final GenericData.Record record = new GenericData.Record(schema);
schema.getFields().forEach(r -> record.put(r.name(), PropertyAccessorFactory.forDirectFieldAccess(object).getPropertyValue(r.name())));
return record;
}
public static <T> T mapRecordToObject(GenericData.Record record, T object) {
Assert.notNull(record, "record must not be null");
Assert.notNull(object, "object must not be null");
final Schema schema = ReflectData.get().getSchema(object.getClass());
Assert.isTrue(schema.getFields().equals(record.getSchema().getFields()), "Schema fields didn't match");
record
.getSchema()
.getFields()
.forEach(field ->
PropertyAccessorFactory
.forDirectFieldAccess(object)
.setPropertyValue(field.name(), record.get(field.name()))
);
return object;
}
}