Rで、特にdplyr
、dtplyr
とdata.table
の間でデータラングリングを行うための学習努力を投資する必要がありますか?
主にdplyr
を使用しますが、データが大きすぎる場合はdata.table
を使用しますが、これはまれなケースです。したがって、dtplyr
v1.0がdata.table
のインターフェースとして使用できるようになったので、表面上はdata.table
インターフェースの使用について二度と心配する必要がないようです。
したがって、現時点でdtplyr
を使用してできないことができないdata.table
の最も有用な機能または側面は何ですか? dtplyr
?
一見すると、dplyr
はdata.table
の利点を備えており、dtplyr
がdplyr
を追い越すように聞こえます。 dplyr
が完全に成熟した後、dtplyr
を使用する理由はありますか?
注:私はdplyr
とdata.table
については質問していません(- data.table vs dplyr:他の人がうまくやることができるか、うまくできないか のように)。特定の問題では、他のものよりも優先されますが、なぜdtplyr
が使用するツールにならないのですか?.
結合時に列を更新します。いくつかの.SDトリック多数のf関数そして、#rdatatableは単なるライブラリではなく、いくつかの関数で要約できないため、神は他に何を知っていますか
それ自体が完全なエコシステムです
Rを始めた日以来、dplyrは必要ありませんでした。data.tableは非常に優れているため
非等価結合とローリング結合が思い浮かびます。同等の関数をdplyrに組み込む計画はないようで、dtplyrが変換するものは何もありません。
また、dplyrにはない再成形(reshape2の同じ関数と同等の最適化されたdcastおよびMelt)もあります。
すべての* _if関数と* _at関数は、現在dtplyrでも変換できませんが、それらは動作中です。