Tidyrのドキュメントでは、ギャザーとスプレッドは推移的であることが示唆されていますが、「iris」データを含む次の例はそうではないことを示していますが、理由は明らかではありません。明確化をいただければ幸いです
iris.df = as.data.frame(iris)
long.iris.df = iris.df %>% gather(key = feature.measure, value = size, -Species)
w.iris.df = long.iris.df %>% spread(key = feature.measure, value = size, -Species)
データフレーム「w.iris.df」が「iris.df」と同じであることを期待していましたが、代わりに次のエラーを受け取りました。
「エラー:行の識別子が重複しています(1、2、3、4、5、6、7、8、9 ...)」
私の一般的な質問は、この種のデータセットでの「収集」の適用をどのように逆にするかです。
ハドレーの介入は驚くほど完璧でした...しかし、私はその後少し構文をいじくりました...そのため、それが価値があるもののために、完全に操作可能なコードを投稿します(申し訳ありませんが私の構文は上記とは少し異なります):
library(tidyr)
library(dplyr)
wide <-
iris %>%
mutate(row = row_number()) %>%
gather(vars, val, -Species, -row) %>%
spread(vars, val)
head(wide)
# Species row Petal.Length Petal.Width Sepal.Length Sepal.Width
# 1 setosa 1 1.4 0.2 5.1 3.5
# 2 setosa 2 1.4 0.2 4.9 3.0
# 3 setosa 3 1.3 0.2 4.7 3.2
# 4 setosa 4 1.5 0.2 4.6 3.1
# 5 setosa 5 1.4 0.2 5.0 3.6
# 6 setosa 6 1.7 0.4 5.4 3.9
head(iris)
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1 5.1 3.5 1.4 0.2 setosa
# 2 4.9 3.0 1.4 0.2 setosa
# 3 4.7 3.2 1.3 0.2 setosa
# 4 4.6 3.1 1.5 0.2 setosa
# 5 5.0 3.6 1.4 0.2 setosa
# 6 5.4 3.9 1.7 0.4 setosa
彼らは同じです....あなたがそれのように感じたらただ並べ替える必要があります...
wide <- wide[,c(3, 4, 5, 6, 1)] ## Reorder and then remove "row" column
完了しました。
前の答えは十分に明確ではなかったかもしれないので、gather
を実行しようとすると表示されるspread
の実行方法に問題があります。
問題は、収集の過程で、どのfeature.measure
は元のデータフレームのどの行に属しているので、spread
は個々の値を再び「ワイド」テーブルに結合する方法を知りません。
iris.df = as.data.frame(iris)
long.iris.df = iris.df %>%
tibble::rowid_to_column() %>%
gather(key = feature.measure, value = size, -Species, -rowid)
#> rowid Species feature.measure size
#> 1 1 setosa Sepal.Length 5.1
#> 2 2 setosa Sepal.Length 4.9
#> 3 3 setosa Sepal.Length 4.7
#> 4 4 setosa Sepal.Length 4.6
#> 5 5 setosa Sepal.Length 5.0
#> 6 6 setosa Sepal.Length 5.4
size
の各値はrowid
を保持するので、いつでもワイドデータセットに再結合できます(不要なrowid
を削除します)。
w.iris.df = long.iris.df %>%
spread(key = feature.measure, value = size) %>%
select(-rowid)
head(w.iris.df)
#> Species Petal.Length Petal.Width Sepal.Length Sepal.Width
#> 1 setosa 1.4 0.2 5.1 3.5
#> 2 setosa 1.4 0.2 4.9 3.0
#> 3 setosa 1.3 0.2 4.7 3.2
#> 4 setosa 1.5 0.2 4.6 3.1
#> 5 setosa 1.4 0.2 5.0 3.6
#> 6 setosa 1.7 0.4 5.4 3.9