2つの多変量時系列xとyがあり、どちらもほぼ同じ時間範囲をカバーしています(一方は他方の2年前に開始しますが、同じ日に終了します)。どちらのシリーズにも、日付列の横に空の列の形で観測値が欠落しています。また、シリーズの1つに、他のシリーズにはない日付がいくつかあるという意味で、またはその逆の意味でです。
X OR yで見つかったすべての日付を、重複する日付なしでリストする列を持つデータフレーム(または同様のもの)を作成したいと思います。各日付(行)について、 xからの観測値をyからの観測値の隣に水平に積み重ね、NAが欠落しているセルを埋めます。例:
>x
"1987-01-01" 7.1 NA 3
"1987-01-02" 5.2 5 2
"1987-01-06" 2.3 NA 9
>y
"1987-01-01" 55.3 66 45
"1987-01-03" 77.3 87 34
# result I would like
"1987-01-01" 7.1 NA 3 55.3 66 45
"1987-01-02" 5.2 5 2 NA NA NA
"1987-01-03" NA NA NA 77.3 87 34
"1987-01-06" 2.3 NA 9 NA NA NA
私が試したこと:Zooパッケージを使用して、merge.Zooメソッドを試しましたが、これは2つのシリーズを日付とともに(数字として、たとえば「1987-01-02」と表示して)積み重ねているようです。 6210として)2つの別々の列に表示される各シリーズから。
私は何時間も座ってほとんどどこにも行かなかったので、すべての助けに感謝します。
編集:Soumendraからの提案に従って以下に含まれるいくつかのコード
atcoa <- read.csv(file = "ATCOA_full_adj.csv", header = TRUE)
atcob <- read.csv(file = "ATCOB_full_adj.csv", header = TRUE)
atcoa$date <- as.Date(atcoa$date)
atcob$date <- as.Date(atcob$date)
# only number of observations and the observations themselves differ
>str(atcoa)
'data.frame': 6151 obs. of 8 variables:
$ date :Class 'Date' num [1:6151] 6210 6213 6215 6216 6217 ...
$ max : num 4.31 4.33 4.38 4.18 4.13 4.05 4.08 4.05 4.08 4.1 ...
$ min : num 4.28 4.31 4.28 4.13 4.05 3.95 3.97 3.95 4 4.02 ...
$ close : num 4.31 4.33 4.31 4.15 4.1 3.97 4 3.97 4.08 4.02 ...
$ avg : num NA NA NA NA NA NA NA NA NA NA ...
$ tot.vol : int 877733 89724 889437 1927113 3050611 846525 1782774 1497998 2504466 5636999 ...
$ turnover : num 3762300 388900 3835900 8015900 12468100 ...
$ transactions: int 12 9 24 17 31 26 34 35 37 33 ...
>atcoa[1:1, ]
date a.max a.min a.close a.avg a.tot.vol a.turnover a.transactions
1 1987-01-02 4.31 4.28 4.31 NA 877733 3762300 12
# using timeSeries package
ts.atcoa <- timeSeries::as.timeSeries(atcoa, format = "%Y-%m-%d")
ts.atcob <- timeSeries::as.timeSeries(atcob, format = "%Y-%m-%d")
>str(ts.atcoa)
Time Series:
Name: object
Data Matrix:
Dimension: 6151 7
Column Names: a.max a.min a.close a.avg a.tot.vol a.turnover a.transactions
Row Names: 1970-01-01 01:43:30 ... 1970-01-01 04:12:35
Positions:
Start: 1970-01-01 01:43:30
End: 1970-01-01 04:12:35
With:
Format: %Y-%m-%d %H:%M:%S
FinCenter: GMT
Units: a.max a.min a.close a.avg a.tot.vol a.turnover a.transactions
Title: Time Series Object
Documentation: Wed Aug 17 13:00:50 2011
>ts.atcoa[1:1, ]
GMT
a.max a.min a.close a.avg a.tot.vol a.turnover a.transactions
1970-01-01 01:43:30 4.31 4.28 4.31 NA 877733 3762300 12
# The following will create an object of class "data frame" and mode "list", which contains observations for the days mutual for the two series
>ts.atco <- timeSeries::merge(atcoa, atcob) # produces same result as base::merge, apparently
>ts.atco[1:1, ]
date a.max a.min a.close a.avg a.tot.vol a.turnover a.transactions b.max b.min b.close b.avg b.tot.vol b.turnover b.transactions
1 1989-08-25 7.92 7.77 7.79 NA 269172 2119400 19 7.69 7.56 7.64 NA 81176693 593858000 12
編集:(Zooパッケージを使用して)解決された問題
atcoa <- read.Zoo(read.csv(file = "ATCOA_full_adj.csv", header = TRUE))
atcob <- read.Zoo(read.csv(file = "ATCOB_full_adj.csv", header = TRUE))
names(atcoa) <- c("a.max", "a.min", "a.close",
"a.avg", "a.tot.vol", "a.turnover", "a.transactions")
names(atcob) <- c("b.max", "b.min", "b.close",
"b.avg", "b.tot.vol", "b.turnover", "b.transactions")
atco <- merge.Zoo(atcoa, atcob)
よろしくお願いします。
これを試して:
Lines.x <- '"1987-01-01" 7.1 NA 3
"1987-01-02" 5.2 5 2
"1987-01-06" 2.3 NA 9'
Lines.y <- '"1987-01-01" 55.3 66 45
"1987-01-03" 77.3 87 34'
library(Zoo)
# in reality x might be in a file and might be read via: x <- read.Zoo("x.dat")
# ditto for y. See ?read.Zoo and the Zoo-read vignette if you need other args too
x <- read.Zoo(text = Lines.x)
y <- read.Zoo(text = Lines.y)
merge(x, y)
与える:
V2.x V3.x V4.x V2.y V3.y V4.y
1987-01-01 7.1 NA 3 55.3 66 45
1987-01-02 5.2 5 2 NA NA NA
1987-01-03 NA NA NA 77.3 87 34
1987-01-06 2.3 NA 9 NA NA NA
日付からtimeSeries(timeSeriesライブラリ)オブジェクトを作成し、それらをマージして(timeSeriesのデフォルトのマージ動作はZooやxtsとは異なり、要求どおりに実行します)、結果からZoo/xtsオブジェクトを作成できます。 timeSeriesにとどまりたくない。
2つのZooオブジェクトzz1とzz2-があると仮定して、テストする簡単な方法の1つは次のとおりです。
library(timeSeries)
as.Zoo(merge(as.timeSeries(zz1), as.timeSeries(zz2)))
上記のコマンドの出力を
merge(zz1, zz2)
Cbindすることもできます-
cbind(zz1, zz2)
同じ名前の共有列がない場合。そのような列が存在する場合でも、結合する列を選択すると、Zooオブジェクトを取得できます。
cbind(zz1[, 1:2], zz2[, 2:3]) #Assuming other columns are common
ここで、stat.ethz.chからより一般的なアプローチを見つけました
a <- ts(1:10, start=c(2014,6), frequency=12)
b <- ts(1:12, start=c(2015,1), frequency=12)
library(Zoo)
m <- merge(a = as.Zoo(a), b = as.Zoo(b))
tsオブジェクトを取り戻すには:
as.ts(m)
これはどう:
## Generate unique sorted time values.
i <- sort(unique(c(index(x), index(y))))
## Empty data matrix.
v <- matrix(nrow=length(i), ncol=6, NA)
## Pull in data items.
v[match(index(x), i), 1:3] <- coredata(x)
v[match(index(y), i), 4:6] <- coredata(y)
## Build new Zoo object.
d <- Zoo(v, order.by=i)