web-dev-qa-db-ja.com

リシェイプrを使用してデータを「アンメルト」する方法

「溶かさない」ようにしたいリシェイプパッケージを使用して溶かしたデータフレームがあります。

これは溶けたデータのおもちゃの例です(実際のデータフレームは500x100以上です)。

variable<-c(rep("X1",3),rep("X2",3),rep("X3",3))
value<-c(rep(rnorm(1,.5,.2),3),rep(rnorm(1,.5,.2),3),rep(rnorm(1,.5,.2),3))
dat <-data.frame(variable,value)
dat
 variable     value
1       X1 0.5285376
2       X1 0.5285376
3       X1 0.5285376
4       X2 0.1694908
5       X2 0.1694908
6       X2 0.1694908
7       X3 0.7446906
8       X3 0.7446906
9       X3 0.7446906

各変数(X1、X2、X3)には、3つの異なる時間に推定された値があります(このおもちゃの例ではたまたま同じですが、これは当てはまりません)。

私はそれを(バック)の形で手に入れたいです:

     X1        X2        X3
1 0.5285376 0.1694908 0.7446906
2 0.5285376 0.1694908 0.7446906
3 0.5285376 0.1694908 0.7446906

基本的に、可変列をID(X1、X2など)でソートして、列見出しにしたいと思います。キャスト、dcast、リキャストなどのさまざまな組み合わせを試してみましたが、希望する形式でデータを取得できないようです。ワイドフォームからロングフォーム(dat datsetなど)にデータを「融合」するのは簡単でしたが、元に戻すことは困難であることが判明しています。何か案は?私はこれが比較的単純であることを知っていますが、これをreshapeまたはreshape2で行う方法を概念化するのに苦労しています。

おかげで、LP

16
LP_640

通常、これを行うには、id列を作成してからdcastを使用します。

> dat
  variable     value
1       X1 0.4299397
2       X1 0.4299397
3       X1 0.4299397
4       X2 0.2531551
5       X2 0.2531551
6       X2 0.2531551
7       X3 0.3972119
8       X3 0.3972119
9       X3 0.3972119
> dat$id <- rep(1:3,times = 3)
> dcast(data = dat,formula = id~variable,fun.aggregate = sum,value.var = "value")
  id        X1        X2        X3
1  1 0.4299397 0.2531551 0.3972119
2  2 0.4299397 0.2531551 0.3972119
3  3 0.4299397 0.2531551 0.3972119
21
joran

これをどの程度堅牢にする必要があるかに応じて、以下は、変数の出現回数をさまざまな数で(任意の順序で)正しくキャストします。

> variable<-c(rep("X1",5),rep("X2",4),rep("X3",3))
> value<-c(rep(rnorm(1,.5,.2),5),rep(rnorm(1,.5,.2),4),rep(rnorm(1,.5,.2),3))
> dat <-data.frame(variable,value)
> dat <- dat[order(rnorm(nrow(dat))),]
> dat
   variable     value
11       X3 1.0294454
8        X2 0.6147509
2        X1 0.3537012
7        X2 0.6147509
9        X2 0.6147509
5        X1 0.3537012
4        X1 0.3537012
12       X3 1.0294454
3        X1 0.3537012
1        X1 0.3537012
10       X3 1.0294454
6        X2 0.6147509
> dat$id = numeric(nrow(dat))
> for (i in 1:nrow(dat)){
+   dat_temp <- dat[1:i,]
+   dat[i,]$id <- nrow(dat_temp[dat_temp$variable == dat[i,]$variable,])
+ }
> cast(dat, id~variable, value = 'value')
  id        X1        X2       X3
1  1 0.3537012 0.6147509 1.029445
2  2 0.3537012 0.6147509 1.029445
3  3 0.3537012 0.6147509 1.029445
4  4 0.3537012 0.6147509       NA
5  5 0.3537012        NA       NA
1
Leo