ここでは、文字ベクトルをdatetimeクラスに変換する方法について質問するいくつかの質問に答えました。 strptimeとas.POSIXct/as.POSIXltの2つのメソッドをよく目にします。私は2つの機能を見ましたが、その違いは不明です。
function (x, format, tz = "")
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>
function (x, tz = "", ...)
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>
function (x, tz = "", ...)
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>
マイクロベンチマークを実行して、パフォーマンスの違いがあるかどうかを確認します。
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422
strptimeは少し速いようです。それで何が得られますか?なぜ似たような機能が2つあるのでしょうか、それとも私が見落としていた機能の違いがありますか?
さて、関数は異なることをします。
最初に、日付/時刻の2つの内部実装があります。POSIXct
はUNIXエポック(+その他のデータ)以降の秒を格納し、POSIXlt
は日、月、年のリストを格納します、時間、分、秒など.
strptime
は、(さまざまな形式の)文字ベクトルをPOSIXlt
形式に直接変換する関数です。
as.POSIXlt
は、さまざまなデータ型をPOSIXlt
に変換します。インテリジェントになり、賢明なことをしようとします-文字の場合、strptime
のラッパーとして機能します。
as.POSIXct
は、さまざまなデータ型をPOSIXct
に変換します。また、インテリジェントになり、賢明なことをしようとします-文字の場合、strptime
を最初に実行し、次にPOSIXlt
からPOSIXct
への変換を行います。
strptime
は文字入力のみを処理し、他の入力は使用するメソッドを入力タイプから決定しようとするため、strptime
の方が高速です。また、予期しないデータが渡されると、必要なものではないインテリジェントなことをしようとするのではなく、単にエラーが発生するため、少し安全です。
POSIXctとPOSIXltの2つのPOSIXtタイプがあります。 「ct」はカレンダー時間を表すことができ、Originからの秒数を保存します。 「lt」、つまり現地時間は、日付を時間属性のリスト(「hour」や「mon」など)として保持します。これらの例を試してください:
date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")
date=c("26/10/2016")
time=c("19:51:30")
day<-paste(date,"T", time)
day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time1
day.time1$year
day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time2
day.time2$year