Hive構造体のすべての列から*を選択する必要があります。
Hive createtableスクリプトは以下のとおりです
テーブルから*を選択すると、各構造体が列として表示されます テーブルから*を選択
私が持っている要件は、Hiveの列として構造体コレクションのすべてのフィールドを表示することです。
ユーザーは列名を個別に記述する必要はありません。誰かがこれを行うためのUDFを持っていますか?
デモ
create table t
(
i int
,s1 struct<id:int,birthday:date,fname:string>
,s2 struct<id:int,lname:string>
)
;
insert into t
select 1
,named_struct('id',333,'birthday',date '1941-10-13','fname','Paul')
,named_struct('id',444,'lname','Simon')
;
insert into t
select 2
,named_struct('id',777,'birthday',date '1941-11-05','fname','Art')
,named_struct('id',888,'lname','Garfunkel')
;
select * from t
;
+-----+---------------------------------------------------+--------------------------------+
| t.i | t.s1 | t.s2 |
+-----+---------------------------------------------------+--------------------------------+
| 1 | {"id":333,"birthday":"1941-10-13","fname":"Paul"} | {"id":444,"lname":"Simon"} |
| 2 | {"id":777,"birthday":"1941-11-05","fname":"Art"} | {"id":888,"lname":"Garfunkel"} |
+-----+---------------------------------------------------+--------------------------------+
select i
,i1.*
,i2.*
from t
lateral view inline (array(s1)) i1
lateral view inline (array(s2)) i2
;
+---+-------+-------------+----------+-------+-----------+
| i | i1.id | i1.birthday | i1.fname | i2.id | i2.lname |
+---+-------+-------------+----------+-------+-----------+
| 1 | 333 | 1941-10-13 | Paul | 444 | Simon |
| 2 | 777 | 1941-11-05 | Art | 888 | Garfunkel |
+---+-------+-------------+----------+-------+-----------+
テーブルの上にビューを使用するか、必要なスキーマに基づいて他のいくつかのテーブルにデータをダンプすることができます。ビューの構文:-
create view foodmart.customerfs_view as select rcrm.customer_id .....
from foodmart.customerfs_view