web-dev-qa-db-ja.com

rで複数の値を拡散またはキャストする方法

この例のおもちゃのデータセットは次のとおりです。

data <- data.frame(x=rep(c("red","blue","green"),each=4), y=rep(letters[1:4],3), value.1 = 1:12, value.2 = 13:24)

       x y value.1 value.2
1    red a       1      13
2    red b       2      14
3    red c       3      15
4    red d       4      16
5   blue a       5      17
6   blue b       6      18
7   blue c       7      19
8   blue d       8      20
9  green a       9      21
10 green b      10      22
11 green c      11      23
12 green d      12      24

変数yをキャストまたは拡散して、次のワイドdata.frameを生成するにはどうすればよいですか。

     x a.value.1 b.value.1 c.value.1 d.value.1 a.value.2 b.value.2 c.value.2 d.value.2
1  blue         5         6         7         8        17        18        19        20
2 green         9        10        11        12        21        22        23        24
3   red         1         2         3         4        13        14        15        16
11
Rokmc1050

_dplyr/tidyr_を使用してこれを行うことができます。キー/値列のペア( 'Var/Val')に結合する列(starts_with('value'))を指定するgatherを使用して、 'データ'を 'ワイド'から 'ロング'形式に再形成します)、unite'Var 'および' y '列を使用して単一の' Var1 '列を作成し、spreadを使用して' wide '形式に再変換します。

_ library(dplyr)
 library(tidyr)
 data %>%
      gather(Var, val, starts_with("value")) %>% 
      unite(Var1,Var, y) %>% 
      spread(Var1, val)

 #      x value.1_a value.1_b value.1_c value.1_d value.2_a value.2_b   value.2_c
 #1   blue         5         6         7         8        17        18        19
 #2  green         9        10        11        12        21        22        23
 #3    red         1         2         3         4        13        14        15
 #    value.2_d
 #1        20
 #2        24
 #3        16
_

更新

(6ヶ月後)

dcastを使用せずに、_data.table_1.9.5_からmeltを使用して、複数の値の列をワイドに再形成できるようになりました。開発バージョンは here からインストールできます。

_ library(data.table)
 dcast(setDT(data), x~y, value.var=c('value.1', 'value.2'))
 #       x a_value.1 b_value.1 c_value.1 d_value.1 a_value.2 b_value.2 c_value.2
 #1:  blue         5         6         7         8        17        18        19
 #2: green         9        10        11        12        21        22        23
 #3:   red         1         2         3         4        13        14        15
 #   d_value.2
 #1:        20
 #2:        24
 #3:        16
_
16
akrun

melt最初にdcast

library(reshape2)
data1 <- melt(data, id.vars = c("x", "y"))
dcast(data1, x ~ variable + y)
#      x value.1_a value.1_b value.1_c value.1_d value.2_a value.2_b value.2_c value.2_d
#1  blue         5         6         7         8        17        18        19        20
#2 green         9        10        11        12        21        22        23        24
#3   red         1         2         3         4        13        14        15        16
5
Roland