ローカルデータフレームに列がある場合、時々Variables not shown
このような(とんでもない)例では、十分な列が必要でした。
library(dplyr)
library(ggplot2) # for movies
movies %.%
group_by(year) %.%
summarise(Length = mean(length), Title = max(title),
Dramaz = sum(Drama), Actionz = sum(Action),
Action = sum(Action), Comedyz = sum(Comedy)) %.%
mutate(Year1 = year + 1)
year Length Title Dramaz Actionz Action Comedyz
1 1898 1.000000 Pack Train at Chilkoot Pass 1 0 0 2
2 1894 1.000000 Sioux Ghost Dance 0 0 0 0
3 1902 3.555556 Voyage dans la lune, Le 1 0 0 2
4 1893 1.000000 Blacksmith Scene 0 0 0 0
5 1912 24.382353 Unseen Enemy, An 22 0 0 4
6 1922 74.192308 Trapped by the Mormons 20 0 0 16
7 1895 1.000000 Photographe 0 0 0 0
8 1909 9.266667 What Drink Did 14 0 0 7
9 1900 1.437500 Uncle Josh's Nightmare 2 0 0 5
10 1919 53.461538 When the Clouds Roll by 17 2 2 29
.. ... ... ... ... ... ... ...
Variables not shown: Year1 (dbl)
見たい Year1
!できればデフォルトで、すべての列を表示するにはどうすればよいですか。
glimpse
が好きかもしれません:
> movies %>%
+ group_by(year) %>%
+ summarise(Length = mean(length), Title = max(title),
+ Dramaz = sum(Drama), Actionz = sum(Action),
+ Action = sum(Action), Comedyz = sum(Comedy)) %>%
+ mutate(Year1 = year + 1) %>% glimpse()
Variables:
$ year (int) 1893, 1894, 1895, 1896, 1897, 1898, 1899, 1900, 1901, 1902,...
$ Length (dbl) 1.000000, 1.000000, 1.000000, 1.307692, 1.000000, 1.000000,...
$ Title (chr) "Blacksmith Scene", "Sioux Ghost Dance", "Photographe", "Ve...
$ Dramaz (int) 0, 0, 0, 1, 0, 1, 2, 2, 5, 1, 2, 3, 4, 5, 1, 8, 14, 14, 14,...
$ Actionz (int) 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 3, 0, 0, 0, 0, 3, 0, 0, 1, 0,...
$ Action (int) 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 3, 0, 0, 0, 0, 3, 0, 0, 1, 0,...
$ Comedyz (int) 0, 0, 0, 1, 2, 2, 1, 5, 8, 2, 8, 10, 6, 2, 6, 8, 7, 2, 2, 4...
$ Year1 (dbl) 1894, 1895, 1896, 1897, 1898, 1899, 1900, 1901, 1902, 1903,...NULL
dplyr
には、dplyr
オブジェクト用の独自の印刷関数があります。この場合、操作の結果であるオブジェクトはtbl_df
です。一致する印刷関数はdplyr:::print.tbl_df
です。これにより、trunc_mat
は、どの変数を含めて、何が印刷され、何が印刷されないかを担当する関数であることがわかります。
悲しいことに、dplyr:::print.tbl_df
はtrunc_mat
にパラメーターを渡さず、trunc_mat
は表示する変数の選択もサポートしません(行数のみ)。回避策は、dplyrの結果をdata.frame
にキャストし、head
を使用することです。
res = movies %.%
group_by(year) %.%
summarise(Length = mean(length), Title = max(title),
Dramaz = sum(Drama), Actionz = sum(Action),
Action = sum(Action), Comedyz = sum(Comedy)) %.%
mutate(Year1 = year + 1)
head(data.frame(res))
year Length Title Dramaz Actionz Action Comedyz
1 1898 1.000000 Pack Train at Chilkoot Pass 1 0 0 2
2 1894 1.000000 Sioux Ghost Dance 0 0 0 0
3 1902 3.555556 Voyage dans la lune, Le 1 0 0 2
4 1893 1.000000 Blacksmith Scene 0 0 0 0
5 1912 24.382353 Unseen Enemy, An 22 0 0 4
6 1922 74.192308 Trapped by the Mormons 20 0 0 16
Year1
1 1899
2 1895
3 1903
4 1894
5 1913
6 1923
それで、これは少し古いですが、同じ問題に対する答えを探しているときにこれを見つけました。パイピングの精神を保持するこのソリューションを思いつきましたが、機能は受け入れられた答えと同じです(パイプ記号%.%
は廃止され、%>%
)
movies %>%
group_by(year) %>%
summarise(Length = mean(length), Title = max(title),
Dramaz = sum(Drama), Actionz = sum(Action),
Action = sum(Action), Comedyz = sum(Comedy)) %>%
mutate(Year1 = year + 1) %>%
as.data.frame %>%
head
movies %.% group_by(year) %.% ....... %.% print.default
dplyr
は、デフォルトの印刷オプションの代わりに、_dplyr:::print.tbl_df
_を使用して、巨大なデータセットで画面が過負荷にならないようにします。必要なものに最終的に手を加え、自分の間違いから救いたくない場合は、最後に_print.default
_を付けてすべてを吐き出します。
ところで、methods(print)
は、独自のprint
関数を記述する必要があるパッケージの数を示します(たとえば、igraph
またはxts
について考えてください---これらは新しいものです画面に表示する方法を伝える必要があります)。
HTH次のグーグル。