web-dev-qa-db-ja.com

名前の代わりにcolumn-indicesを使用して、data.table列のサブセットに関数を適用します。

大きなdata.tableの列のグループに関数を個別に参照せずに適用しようとしています。

a <- data.table(
  a=as.character(rnorm(5)),
  b=as.character(rnorm(5)),
  c=as.character(rnorm(5)),
  d=as.character(rnorm(5))
)
b <- c('a','b','c','d')

上記のMWEでは、次のようになります。

a[,b=as.numeric(b),with=F]

動作しますが、これ:

a[,b[2:3]:=data.table(as.numeric(b[2:3])),with=F]

動作しません。 aの列2と3だけにas.numeric関数を個別に参照せずに適用する正しい方法は何ですか。

(実際のデータセットには数十の列があるため、実用的ではありません)

33
Tahnoon Pasha

慣用的なアプローチは、.SDおよび.SDcolsを使用することです

()でラップすることにより、RHSを強制的に親フレームで評価させることができます

a[, (b) := lapply(.SD, as.numeric), .SDcols = b]

列2:3の場合

a[, 2:3 := lapply(.SD, as.numeric), .SDcols = 2:3]

または

mysubset <- 2:3
a[, (mysubset) := lapply(.SD, as.numeric), .SDcols = mysubset]
44
mnel