Hiveテーブルに次のタイムスタンプの文字列表現があります。
20130502081559999
次のように文字列に変換する必要があります。
2013-05-02 08:15:59
以下を試しました({code} >>> {result}):
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmss')) >>> 2013-05-03 00:54:59
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssMS')) >>> 2013-09-02 08:15:59
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssMS')) >>> 2013-05-02 08:10:39
タイムスタンプに変換してからunixtimeが奇妙に見える場合、これを行う適切な方法は何ですか?
[〜#〜] edit [〜#〜]わかりました。
from_unixtime(unix_timestamp(substr('20130502081559999',1,14), 'yyyyMMddHHmmss')) >>> 2013-05-02 08:15:59
または
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssSSS')) >>> 2013-05-02 08:15:59
それでも…もっと良い方法はありますか?
「より良い方法」の意味がわからないが、いつでも 独自の関数を作成 して日付変換を処理できます。
形式が3ミリ秒の数字のようです。 SimpleDateFormat によると、以下を使用する必要があると思います。
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssSSS'))
お役に立てば幸いです。
このような入力ファイルがあるとします
file:///data/csv/temptable/temp.csv
1 2015-01-01
2 2015-10-10 12:00:00.232
3 2016-02-02
4 2015-09-12 23:08:07.124
次に、このアプローチを試すこともできます。
create external table temptable(id string, datetime string) row format delimited fields terminated by '\t' stored as textfile LOCATION 'file:///data/csv/temptable';
create table mytime as select id, from_utc_timestamp(date_format(datetime,'yyyy-MM-dd HH:mm:ss.SSS'),'UTC') as datetime from temptable;