NAを除くRの列全体の平均

Question

私がこの質問の最初の人だとは想像できませんが、解決策はまだ見つかりません（ここまたは他の場所）。

Rで平均したい列がいくつかあります。最小限のトリッキーな側面は、一部の列にNAが含まれていることです。

例えば：

Trait Col1 Col2 Col3 DF 23 NA 23 DG 2 2 2 DH NA 9 9

NAを無視して、最初の3列のエントリを平均化するCol4を作成します。そう：

 Trait Col1 Col2 Col3 Col4 DF 23 NA 23 23 DG 2 2 2 2 DH NA 9 9 9

理想的には次のようなものが機能します：

data$Col4 <- mean(data$Chr1, data$Chr2, data$Chr3, na.rm=TRUE)

しかし、そうではありません。

Gavin Simpson · Accepted Answer

rowMeans()が必要ですが、重要なことにna.rm引数に設定するTRUE。例えば。：

> mat <- matrix(c(23,2,NA,NA,2,9,23,2,9), ncol = 3) > mat [,1] [,2] [,3] [1,] 23 NA 23 [2,] 2 2 2 [3,] NA 9 9 > rowMeans(mat) [1] NA 2 NA > rowMeans(mat, na.rm = TRUE) [1] 23 2 9

あなたの例を一致させるには：

> dat <- data.frame(Trait = c("DF","DG","DH"), mat) > names(dat) <- c("Trait", paste0("Col", 1:3)) > dat Trait Col1 Col2 Col3 1 DF 23 NA 23 2 DG 2 2 2 3 DH NA 9 9 > dat <- transform(dat, Col4 = rowMeans(dat[,-1], na.rm = TRUE)) > dat Trait Col1 Col2 Col3 Col4 1 DF 23 NA 23 23 2 DG 2 2 2 2 3 DH NA 9 9 9