web-dev-qa-db-ja.com

1つの列の要因でデータフレームを分割/サブセット化する

私のデータは次のようなものです(例):

ID  Rate    State
1   24  AL
2   35  MN
3   46  FL
4   34  AL
5   78  MN
6   99  FL

データ:

structure(list(ID = 1:6, Rate = c(24L, 35L, 46L, 34L, 78L, 99L),
               State = structure(c(1L, 3L, 2L, 1L, 3L, 2L),
                                 .Label = c("AL","FL", "MN"),
                                 class = "factor")),
          .Names = c("ID", "Rate", "State"),
          class = "data.frame", row.names = c(NA, -6L))

状態ごとにデータを分割し、次のような3つのデータセットを取得します。

data set 1
ID  Rate    State
1   24  AL
4   34  AL
data set 2
ID  Rate    State
2   35  MN
5   78  MN
data set 3
ID  Rate    State
3   46  FL
6   99  FL

使用する機能

分割またはサブセット機能について考えていましたが、まだ手がかりがありません。

28
titi

splitを使用できます。

mylist <- split(df, df$State)

mylist
$AL
  ID Rate State
1  1   24    AL
4  4   34    AL

$FL
  ID Rate State
3  3   46    FL
6  6   99    FL

$MN
  ID Rate State
2  2   35    MN
5  5   78    MN

要素番号にアクセスするには:

mylist[[1]]

または名前で:

mylist$AL
  ID Rate State
1  1   24    AL
4  4   34    AL

?split

説明

splitは、ベクトルxのデータをfで定義されたグループに分割します。置換フォームは、そのような区分に対応する値を置換します。 unsplitは、スプリットの効果を逆にします。

50
Simon O'Hanlon