



    row_number() over(order by price) as row_number,
    rank() over(order by price) as rank,
    count(*) over(order by price) as count,
    dense_rank() over(order by price) as dense_rank,
    ntile(10) over(order by price) as decile
from paintings
order by price;



│ id │ title                                      │ price │ row_number │ rank │ count │ dense_rank │ decile │
│ 11 │ Eyes in the Heat                           │ 10    │ 1          │ 1    │ 1     │ 1          │ 1      │
│ 19 │ Deux fillettes, fond jaune et rouge        │ 11    │ 2          │ 2    │ 2     │ 2          │ 1      │
│ 17 │ Flowers in a Pitcher                       │ 12    │ 3          │ 3    │ 6     │ 3          │ 1      │
│ 5  │ Composition with Red, Yellow and Blue      │ 12    │ 4          │ 3    │ 6     │ 3          │ 2      │
│ 18 │ La lecon de musique (The Music Lesson)     │ 12    │ 5          │ 3    │ 6     │ 3          │ 2      │
│ 9  │ The Adoration of the Magi                  │ 12    │ 6          │ 3    │ 6     │ 3          │ 2      │
│ 29 │ Self-Portrait                              │ 14    │ 7          │ 7    │ 10    │ 4          │ 3      │
│ 25 │ Symphony in White, No. 1: The White Girl   │ 14    │ 8          │ 7    │ 10    │ 4          │ 3      │
│ 30 │ The Anatomy Lecture of Dr. Nicolaes Tulp   │ 14    │ 9          │ 7    │ 10    │ 4          │ 3      │
│ 20 │ Les repasseuses (Women Ironing)            │ 14    │ 10         │ 7    │ 10    │ 4          │ 4      │
│ 1  │ The Birth of Venus                         │ 15    │ 11         │ 11   │ 14    │ 5          │ 4      │
│ 12 │ Femme se promenant dans une foret exotique │ 15    │ 12         │ 11   │ 14    │ 5          │ 4      │
│ 24 │ Portrait of the Painter’s Mother           │ 15    │ 13         │ 11   │ 14    │ 5          │ 5      │
│ 28 │ Jeunes filles au piano                     │ 15    │ 14         │ 11   │ 14    │ 5          │ 5      │
│ 7  │ Portrait de l artiste (Self-portrait)      │ 16    │ 15         │ 15   │ 17    │ 6          │ 5      │
│ 3  │ The Last Supper                            │ 16    │ 16         │ 15   │ 17    │ 6          │ 6      │
│ 13 │ Combat of a Tiger and a Buffalo            │ 16    │ 17         │ 15   │ 17    │ 6          │ 6      │
│ 4  │ The Creation of Man                        │ 17    │ 18         │ 18   │ 19    │ 7          │ 6      │
│ 22 │ Le Chemin de Fer                           │ 17    │ 19         │ 18   │ 19    │ 7          │ 7      │
│ 6  │ Femmes de Tahiti [Sur la plage]            │ 18    │ 20         │ 20   │ 24    │ 8          │ 7      │
│ 21 │ Le Bar aux Folies-Berg                     │ 18    │ 21         │ 20   │ 24    │ 8          │ 7      │
│ 26 │ Lady at the Piano                          │ 18    │ 22         │ 20   │ 24    │ 8          │ 8      │
│ 15 │ Remembrance of a Garden                    │ 18    │ 23         │ 20   │ 24    │ 8          │ 8      │
│ 16 │ 1914                                       │ 18    │ 24         │ 20   │ 24    │ 8          │ 8      │
│ 14 │ Ancient Sound, Abstract on Black           │ 19    │ 25         │ 25   │ 28    │ 9          │ 9      │
│ 8  │ The Large Turf                             │ 19    │ 26         │ 25   │ 28    │ 9          │ 9      │
│ 23 │ On the Beach                               │ 19    │ 27         │ 25   │ 28    │ 9          │ 9      │
│ 2  │ Portrait of Mona Lisa                      │ 19    │ 28         │ 25   │ 28    │ 9          │ 10     │
│ 27 │ On the Terrace                             │ 20    │ 29         │ 29   │ 30    │ 10         │ 10     │
│ 10 │ The She-Wolf                               │ 20    │ 30         │ 29   │ 30    │ 10         │ 10     │



ntile()row_number()のみを使用し、それを基準にカットオフを行っているようです。 rank()関数またはcount(*)関数のいずれかを使用した場合、同じ価格のアイテムは同じビンに入れられるため、より公平になります。

これは、PostgreSQLとSQL Serverの両方の動作で、おそらく残りの動作です。




declare @BinCount int = 10;
declare @BinSize int;
select @BinSize = 1 + count(*) / @BinCount from @T;

select T.id,
       1 + rank() over(order by T.price) / @BinSize as decile
from @T as T;


id  title                                       price  decile
--- ------------------------------------------- ------ --------------------
19  Deux fillettes, fond jaune et rouge         11     1
17  Flowers in a Pitcher                        12     1
5   Composition with Red, Yellow and Blue       12     1
18  La lecon de musique (The Music Lesson)      12     1
9   The Adoration of the Magi                   12     1
29  Self-Portrait                               14     3
25  Symphony in White, No. 1: The White Girl    14     3
30  The Anatomy Lecture of Dr. Nicolaes Tulp    14     3
20  Les repasseuses (Women Ironing)             14     3
1   The Birth of Venus                          15     4
12  Femme se promenant dans une foret exotique  15     4
24  Portrait of the Painter’s Mother            15     4
28  Jeunes filles au piano                      15     4
7   Portrait de l artiste (Self-portrait)       16     5
3   The Last Supper                             16     5
13  Combat of a Tiger and a Buffalo             16     5
4   The Creation of Man                         17     6
22  Le Chemin de Fer                            17     6
6   Femmes de Tahiti [Sur la plage]             18     7
21  Le Bar aux Folies-Berg                      18     7
26  Lady at the Piano                           18     7
15  Remembrance of a Garden                     18     7
16  1914                                        18     7
14  Ancient Sound, Abstract on Black            19     9
8   The Large Turf                              19     9
23  On the Beach                                19     9
2   Portrait of Mona Lisa                       19     9
27  On the Terrace                              20     10
10  The She-Wolf                                20     10



CREATE FUNCTION dbo.width_bucket(@val decimal, @min_val decimal, @max_val decimal, @groups int)
    DECLARE @res int;

    IF @val = @max_val RETURN @groups;

    RETURN CAST((@val - @min_val) / ((@max_val - @min_val) / @groups) AS int) + 1;

    id, title, price, dbo.width_bucket(price, 11.0, 20.0, 10)


DECLARE @groups int = 10;

    SELECT MIN(price) AS min_price, MAX(price) AS max_price
    FROM   t
    id, title, price,
            price = max_price THEN @groups
            CAST((price - min_price) / ((max_price - min_price) / @groups) AS int) + 1
    END as ngroup
CROSS APPLY (SELECT min_price, max_price FROM mm) mm;


 id |タイトル|価格| ngroup 
-:| :----------------------------------------- :---- | -----:
 19 | Deuxフィレット、好きなジョーンとルージュ| 11.00 | 1 
 17 |ピッチャーの花| 12.00 | 2 
 5 |赤、黄、青の合成| 12.00 | 2 
 18 | La lecon de musique(音楽レッスン)| 12.00 | 2 
 9 |賢者の礼拝| 12.00 | 2 
 29 |自画像| 14.00 | 4 
 25 |白の交響曲第1番:白い少女| 14.00 | 4 
 30 |ニコラエス・タルプ博士の解剖学講義| 14.00 | 4 
 20 | Les repasseuses(女性アイロン)| 14.00 | 4 
 1 |金星の誕生| 15.00 5 
 12 | Femme se promenant dans une foret exotique | 15.00 5 
 24 |画家の母の肖像| 15.00 5 
 28 |ジューンはauピアノを埋めます| 15.00 5 
 7 | Portrait de l artiste(自画像)| 16.00 | 6 
 3 |最後の晩餐| 16.00 | 6 
 13 |タイガーとバッファローの戦闘| 16.00 | 6 
 4 |人間の創造| 17.00 | 7 
 22 |ルシュマンドフェル| 17.00 | 7 
 6 |フェムスデタヒチ[シュールラプラージュ] | 18.00 | 8 
 21 | Le Bar aux Folies-Berg | 18.00 | 8 
 26 |ピアノの女性| 18.00 | 8 
 15 |庭の記憶| 18.00 | 8 
 16 | 1914年18.00 | 8 
 14 |エンシェントサウンド、アブストラクトブラック| 19.00 | 9 
 8 |大きな芝| 19.00 | 9 
 23 |ビーチで| 19.00 | 9 
 2 |モナリザの肖像|写真モナリザの肖像19.00 | 9 
 27 |テラスで| 20.00 | 10 
 10 |シーウルフ| 20.00 | 10 

_WITH data AS (SELECT count(*)/10.0 AS bin FROM prints WHERE price<20)
    row_number() OVER(ORDER BY price) AS row_number,
    ntile(10) OVER(ORDER BY price) AS decile,
    floor((row_number() OVER(ORDER BY price)-1)/bin)+1 AS row_decile,
    floor((rank() OVER(ORDER BY price)-1)/bin)+1 AS rank_decile,
    floor((count(*) OVER(ORDER BY price)-1)/bin)+1 AS count_decile,
FROM prints,data
WHERE price<20
ORDER BY price;


  • 結果をよりDBニュートラルにするために、ビンサイズを変数ではなくCTEに入れました。
  • WHERE句は、扱いにくいビンサイズを強制するためのものです。 _10.0_は、切り捨てられた整数ではなく、10進数を生成します。
  • row_number()/bin+1計算は、ネイティブのntile関数を複製するために含まれています。



