web-dev-qa-db-ja.com

スタンドアロンで寄木細工のファイルを読み取る方法Javaコード?

clouderaの寄木細工のドキュメントは、pig/Hive/impalaとの統合の例を示しています。しかし、多くの場合、デバッグの目的で寄木細工ファイル自体を読みたいと思います。

寄木細工のファイルを読み取るための簡単なJavaリーダーAPIはありますか?

ありがとうヤン

15
teddy teddy

古い方法:(非推奨)

AvroParquetReader<GenericRecord> reader = new AvroParquetReader<GenericRecord>(file);
GenericRecord nextRecord = reader.read();

新しい方法:

ParquetReader<GenericRecord> reader = AvroParquetReader.<GenericRecord>builder(file).build();
GenericRecord nextRecord = reader.read();

私はこれを here から取得し、テストケースで正常に使用しました。

7
rishiehari

Parquet-avroライブラリのAvroParquetReaderを使用して、寄せ集めファイルをAVRO GenericRecordオブジェクトのセットとして読み取ることができます。

7
kostya