カテゴリごとに最大値を持つ行を選択するPower BI

Question

MのPower BIでカテゴリごとに最大値を持つ行を選択する方法。テーブルがあるとします：

+----------+-------+------------+ | Category | Value | Date | +----------+-------+------------+ | apples | 1 | 2018-07-01 | | apples | 2 | 2018-07-02 | | apples | 3 | 2018-07-03 | | bananas | 7 | 2018-07-04 | | bananas | 8 | 2018-07-05 | | bananas | 9 | 2018-07-06 | +----------+-------+------------+

望ましい結果は次のとおりです。

+----------+-------+------------+ | Category | Value | Date | +----------+-------+------------+ | apples | 3 | 2018-07-03 | | bananas | 9 | 2018-07-06 | +----------+-------+------------+

PBIの開始表は次のとおりです。

let Source = Table.FromRows(Json.Document(Binary.Decompress(Binary.FromText("i45WSiwoyEktVtJRMgRiIwNDC10Dc10DQ6VYHSQ5I2Q5I1Q5Y2Q5Y7BcUmIeEIIkzZElTdAkLZAlTdEkLZElzZRiYwE=", BinaryEncoding.Base64), Compression.Deflate)), let _t = ((type text) meta [Serialized.Text = true]) in type table [Category = _t, Value = _t, Date = _t]), #"Changed Type" = Table.TransformColumnTypes(Source,{{"Category", type text}, {"Value", Int64.Type}, {"Date", type date}}) in #"Changed Type"

マジックカラムIsMaxを追加することで、1つのテーブル内の後続のステップで目的の結果に到達する方法があるのではないかと思います。

+----------+-------+------------+-------+ | Category | Value | Date | IsMax | +----------+-------+------------+-------+ | apples | 1 | 2018-07-01 | 0 | | apples | 2 | 2018-07-02 | 0 | | apples | 3 | 2018-07-03 | 1 | | bananas | 7 | 2018-07-04 | 0 | | bananas | 8 | 2018-07-05 | 0 | | bananas | 9 | 2018-07-06 | 1 | +----------+-------+------------+-------+

Przemyslaw Remin · Accepted Answer

MAXを通じてカテゴリごとにindexを取得することになりました。ここで説明するアイデア： https://stackoverflow.com/a/51498237/190379

アプローチ＃1は、R変換でスニッピングされたワンライナーです：

library(dplyr) output <- dataset %>% group_by(Category) %>% mutate(row_no_by_category = row_number(desc(Date)))

アプローチ＃2、PBIで完全に完了：

let Source = Table.FromRows(Json.Document(Binary.Decompress(Binary.FromText("i45WSiwoyEktVtJRMgRiIwNDC10Dc10DQ6VYHSQ5I2Q5I1Q5Y2Q5Y7BcUmIeEIIkzZElTdAkLZAlTdEkLZElzZRiYwE=", BinaryEncoding.Base64), Compression.Deflate)), let _t = ((type text) meta [Serialized.Text = true]) in type table [Category = _t, Value = _t, Date = _t]), #"Grouped rows" = Table.Group(Source, {"Category"}, {{"NiceTable", each Table.AddIndexColumn(Table.Sort(_,{{"Date", Order.Descending}} ), "Index",1,1), type table}} ), #"Expanded NiceTable" = Table.ExpandTableColumn(#"Grouped rows", "NiceTable", {"Value", "Date", "Index"}, {"Value", "Date", "Index"}), #"Filtered Rows" = Table.SelectRows(#"Expanded NiceTable", each ([Index] = 1)) in #"Filtered Rows"

Alexis Olson · Answer

Power Query Editorで基本的なGroup Byを実行すると（Categoryでグループ化し、Valueで最大値を取得）、次の表が得られます。

+----------+-------+ | Category | Value | +----------+-------+ | apples | 3 | | bananas | 9 | +----------+-------+

単に値1であるカスタム列IsMaxをこのテーブルに追加し、CategoryとValueの両方で一致する元のテーブルとマージ（左外部結合）します。最後に、IsMax列を展開して目的のテーブルを取得します。ただし、0の代わりにnullを使用します。必要に応じて、null値を置き換えることができます。

これらすべてのステップのMコードは次のとおりです。

let Source = Table.FromRows(Json.Document(Binary.Decompress(Binary.FromText("i45WSiwoyEktVtJRMgRiIwNDC10Dc10DQ6VYHSQ5I2Q5I1Q5Y2Q5Y7BcUmIeEIIkzZElTdAkLZAlTdEkLZElzZRiYwE=", BinaryEncoding.Base64), Compression.Deflate)), let _t = ((type text) meta [Serialized.Text = true]) in type table [Category = _t, Value = _t, Date = _t]), #"Changed Type" = Table.TransformColumnTypes(Source,{{"Value", Int64.Type}, {"Date", type date}, {"Category", type text}}), #"Grouped Rows" = Table.Group(#"Changed Type", {"Category"}, {{"Value", each List.Max([Value]), Int64.Type}}), #"Added Custom" = Table.AddColumn(#"Grouped Rows", "IsMax", each 1, Int64.Type), #"Merged Queries" = Table.NestedJoin(#"Changed Type",{"Category", "Value"},#"Added Custom",{"Category", "Value"},"Added Custom",JoinKind.LeftOuter), #"Expanded Added Custom" = Table.ExpandTableColumn(#"Merged Queries", "Added Custom", {"IsMax"}, {"IsMax"}) in #"Expanded Added Custom"

RADO · Answer

計算列を作成します。

IsMax = VAR Max_Value = CALCULATE ( MAX ( Table[Value] ), FILTER ( Table, Table[Category] = EARLIER ( Table[Category] ) ) ) RETURN IF ( Table[Value] = Max_Value, 1, 0 )

仕組み：最初に、FILTER関数は、現在の行と同じカテゴリを持つテーブル内のすべてのレコードを選択し、それらの最大値を見つけます。結果は変数に保存されます。次に、IFは現在の行の値と保存された最大値を比較します。