私はRを初めて使用するので、これは非常に単純な質問です。私は欲しいものに似たものをたくさん見つけましたが、それだけではありません。基本的に複数のデータフレームがあり、それらすべてで同じ関数を実行したいだけです。 forループは機能する可能性がありますが、データフレームを呼び出すように適切に設定する方法がわかりません。また、Rを使用したラップアプローチが最も好ましいようです。これが重複した質問である場合は、お詫び申し上げます。どんな助けでも大歓迎です!
これが私の単純化された例です:2つのデータフレーム:df1、df2
df1
start stop ID
0 10 x
10 20 y
20 30 z
df2
start stop ID
0 10 a
10 20 b
20 30 c
私が欲しいのは、両方のdfの開始と停止の平均を持つ4番目の列です
df1
start stop ID Avg
0 10 x 5
10 20 y 15
20 30 z 25
私はこれで一度に1つのデータフレームを行うことができます:
df1$Avg <- rowMeans(subset(df1, select = c(start, stop)), na.rm = TRUE)
しかし、私はそれをすべてのデータフレームで実行したいと思います。
データフレームのリストを作成し、lapplyを使用してそれらすべてに関数を適用します。
df.list <- list(df1,df2,...)
res <- lapply(df.list, function(x) rowMeans(subset(x, select = c(start, stop)), na.rm = TRUE))
# to keep the original data.frame also
res <- lapply(df.list, function(x) cbind(x,"rowmean"=rowMeans(subset(x, select = c(start, stop)), na.rm = TRUE)))
その後、lapplyは各データフレームにxとして順次フィードします。
それらをリストに入れ、リストに対してrowMeans
を実行します。
df1 <- data.frame(x = rep(3, 5), y = seq(1, 5, 1), ID = letters[1:5])
df2 <- data.frame(x = rep(5, 5), y = seq(2, 6, 1), ID = letters[6:10])
lapply(list(df1, df2), function(w) { w$Avg <- rowMeans(w[1:2]); w })
[[1]]
x y ID Avg
1 3 1 a 2.0
2 3 2 b 2.5
3 3 3 c 3.0
4 3 4 d 3.5
5 3 5 e 4.0
[[2]]
x y ID Avg
1 5 2 f 3.5
2 5 3 g 4.0
3 5 4 h 4.5
4 5 5 i 5.0
5 5 6 j 5.5
同じファイルにすべての出力が必要な場合は、これが役立つことがあります。
df1 <- data.frame(x = rep(3, 5), y = seq(1, 5, 1), ID = letters[1:5])
df2 <- data.frame(x = rep(5, 5), y = seq(2, 6, 1), ID = letters[6:10])
z=list(df1,df2)
df=NULL
for (i in z) {
i$Avg=(i$x+i$y)/2
df<-rbind(df,i)
print (df)
}
> df
x y ID Avg
1 3 1 a 2.0
2 3 2 b 2.5
3 3 3 c 3.0
4 3 4 d 3.5
5 3 5 e 4.0
6 5 2 f 3.5
7 5 3 g 4.0
8 5 4 h 4.5
9 5 5 i 5.0
10 5 6 j 5.5