注:この質問のタイトルは、plyr
関数がdplyr
の対応する関数をマスクする場合の問題の標準的な質問になるように編集されています。残りの質問は変更されていません。
次のデータがあるとします。
dfx <- data.frame(
group = c(rep('A', 8), rep('B', 15), rep('C', 6)),
sex = sample(c("M", "F"), size = 29, replace = TRUE),
age = runif(n = 29, min = 18, max = 54)
)
古き良きplyr
を使用すると、次のコードを使用してデータを要約した小さなテーブルを作成できます。
require(plyr)
ddply(dfx, .(group, sex), summarize,
mean = round(mean(age), 2),
sd = round(sd(age), 2))
出力は次のようになります。
group sex mean sd
1 A F 49.68 5.68
2 A M 32.21 6.27
3 B F 31.87 9.80
4 B M 37.54 9.73
5 C F 40.61 15.21
6 C M 36.33 11.33
コードをdplyr
と%>%
演算子に移動しようとしています。私のコードはDFで、グループと性別でグループ化し、要約します。
dfx %>% group_by(group, sex) %>%
summarise(mean = round(mean(age), 2), sd = round(sd(age), 2))
しかし、私の出力は次のとおりです。
mean sd
1 35.56 9.92
私は何が間違っているのですか?
ここでの問題は、最初にdplyrをロードし、次にplyrをロードするため、plyrの関数summarise
がdplyrの関数summarise
をマスクしていることです。その場合、次の警告が表示されます。
_require(plyr)
Loading required package: plyr
------------------------------------------------------------------------------------------
You have loaded plyr after dplyr - this is likely to cause problems.
If you need functions from both plyr and dplyr, please load plyr first, then dplyr:
library(plyr); library(dplyr)
------------------------------------------------------------------------------------------
Attaching package: ‘plyr’
The following objects are masked from ‘package:dplyr’:
arrange, desc, failwith, id, mutate, summarise, summarize
_
したがって、コードを機能させるには、plyr detach(package:plyr)
をデタッチするか、Rを再起動して、最初にplyrをロードし、次にdplyrをロードします(またはdplyrのみをロードします)。
_library(dplyr)
dfx %>% group_by(group, sex) %>%
summarise(mean = round(mean(age), 2), sd = round(sd(age), 2))
Source: local data frame [6 x 4]
Groups: group
group sex mean sd
1 A F 41.51 8.24
2 A M 32.23 11.85
3 B F 38.79 11.93
4 B M 31.00 7.92
5 C F 24.97 7.46
6 C M 36.17 9.11
_
または、コードでdplyrのsummaryを明示的に呼び出すことができるため、パッケージをどのようにロードしても、適切な関数が呼び出されます。
_dfx %>% group_by(group, sex) %>%
dplyr::summarise(mean = round(mean(age), 2), sd = round(sd(age), 2))
_
「plyr」と「dplyr」をロードした順序が原因で、コードはplyr::summarise
ではなくdplyr::summarise
を呼び出しています。
デモ:
library(dplyr) ## I'm guessing this is the order you loaded
library(plyr)
dfx %>% group_by(group, sex) %>%
summarise(mean = round(mean(age), 2), sd = round(sd(age), 2))
# mean sd
# 1 36.88 9.76
dfx %>% group_by(group, sex) %>%
dplyr::summarise(mean = round(mean(age), 2), sd = round(sd(age), 2))
# Source: local data frame [6 x 4]
# Groups: group
#
# group sex mean sd
# 1 A F 32.17 6.30
# 2 A M 30.98 7.37
# 3 B F 38.20 7.67
# 4 B M 33.12 12.24
# 5 C F 43.91 10.31
# 6 C M 47.53 8.25