大きなdata.tableの列のグループに関数を個別に参照せずに適用しようとしています。
a <- data.table(
a=as.character(rnorm(5)),
b=as.character(rnorm(5)),
c=as.character(rnorm(5)),
d=as.character(rnorm(5))
)
b <- c('a','b','c','d')
上記のMWEでは、次のようになります。
a[,b=as.numeric(b),with=F]
動作しますが、これ:
a[,b[2:3]:=data.table(as.numeric(b[2:3])),with=F]
動作しません。 a
の列2と3だけにas.numeric
関数を個別に参照せずに適用する正しい方法は何ですか。
(実際のデータセットには数十の列があるため、実用的ではありません)
慣用的なアプローチは、.SD
および.SDcols
を使用することです
()
でラップすることにより、RHSを強制的に親フレームで評価させることができます
a[, (b) := lapply(.SD, as.numeric), .SDcols = b]
列2:3の場合
a[, 2:3 := lapply(.SD, as.numeric), .SDcols = 2:3]
または
mysubset <- 2:3
a[, (mysubset) := lapply(.SD, as.numeric), .SDcols = mysubset]