web-dev-qa-db-ja.com

各IDの最大値を取得するための単純なクエリ

OK私はこのようなテーブルを持っています:

ID     Signal    Station    OwnerID
111     -120      Home       1
111     -130      Car        1
111     -135      Work       2
222     -98       Home       2
222     -95       Work       1
222     -103      Work       2

これはすべて同じ日です。各IDの最大シグナルを返すクエリが必要です。

ID    Signal    Station    OwnerID
111   -120      Home        1
222   -95       Work        1

MAX()を使用してみましたが、レコードごとにStationとOwnerIDが異なるため、集計が混乱しました。 JOINを実行する必要がありますか?

18
Nick Sinas

このようなもの?テーブルをそれ自体と結合し、より高いシグナルが見つかった行を除外します。

select cur.id, cur.signal, cur.station, cur.ownerid
from yourtable cur
where not exists (
    select * 
    from yourtable high 
    where high.id = cur.id 
    and high.signal > cur.signal
)

これにより、最も高い信号ごとに1つの行がリストされるため、IDごとに複数の行が存在する可能性があります。

17
Andomar

グループごとの最大/最小操作を実行しています。これは一般的な罠です。簡単にできるはずのように感じますが、SQLではそうではありません。

この問題にはいくつかのアプローチ(標準ANSIとベンダー固有の両方)があり、そのほとんどは多くの状況で最適ではありません。複数の行が同じ最大値/最小値を共有している場合、複数の行が表示されるものもあります。一部はしません。グループの数が少ないテーブルでうまく機能するものもあります。他のグループは、グループあたりの行数が少ない多数のグループに対してより効率的です。

ここに議論があります いくつかの一般的なもの(MySQLに偏っていますが一般的に適用可能)。個人的には、複数の最大値がないことがわかっている場合(またはそれらを取得する必要がない場合)、null-left-self-joinメソッドを使用する傾向があります。これは、他の誰もまだ行っていないため、投稿します。

SELECT reading.ID, reading.Signal, reading.Station, reading.OwnerID
FROM readings AS reading
LEFT JOIN readings AS highersignal
    ON highersignal.ID=reading.ID AND highersignal.Signal>reading.Signal
WHERE highersignal.ID IS NULL;
15
bobince

従来のSQL-92(Quassnoiで使用されるOLAP操作)を使用しない)では、次を使用できます。

SELECT g.ID, g.MaxSignal, t.Station, t.OwnerID
  FROM (SELECT id, MAX(Signal) AS MaxSignal
          FROM t
          GROUP BY id) AS g
       JOIN t ON g.id = t.id AND g.MaxSignal = t.Signal;

(チェックされていない構文。テーブルが「t」であると想定します。)

FROM句のサブクエリは、各IDの最大信号値を識別します。結合は、それをメインテーブルの対応するデータ行と組み合わせます。

注意:特定のIDに複数のエントリがあり、それらすべてが同じ信号強度を持ち、その強度がMAX()である場合、そのIDの複数の出力行を取得します。


Solaris10で実行されているIBMInformix Dynamic Server11.50.FC3に対してテスト済み:

+ CREATE TEMP TABLE signal_info
(
    id      INTEGER NOT NULL,
    signal  INTEGER NOT NULL,
    station CHAR(5) NOT NULL,
    ownerid INTEGER NOT NULL
);
+ INSERT INTO signal_info VALUES(111, -120, 'Home', 1);
+ INSERT INTO signal_info VALUES(111, -130, 'Car' , 1);
+ INSERT INTO signal_info VALUES(111, -135, 'Work', 2);
+ INSERT INTO signal_info VALUES(222, -98 , 'Home', 2);
+ INSERT INTO signal_info VALUES(222, -95 , 'Work', 1);
+ INSERT INTO signal_info VALUES(222, -103, 'Work', 2);
+ SELECT g.ID, g.MaxSignal, t.Station, t.OwnerID
  FROM (SELECT id, MAX(Signal) AS MaxSignal
            FROM signal_info
            GROUP BY id) AS g
      JOIN signal_info AS t  ON g.id = t.id AND g.MaxSignal = t.Signal;

111     -120    Home    1
222     -95     Work    1

このテストでは、テーブルにSignal_Infoという名前を付けましたが、正しい答えが得られるようです。これは、表記をサポートするDBMSが少なくとも1つあることを示しているだけです。ただし、MS SQL Serverが使用していないことに少し驚いています。どのバージョンを使用していますか?


SQLの質問がテーブル名なしで送信される頻度に驚かされることは決してありません。

4

with tab(id, sig, sta, oid) as
(
select 111 as id, -120 as signal, 'Home' as station, 1 as ownerId union all
select 111, -130, 'Car',  1 union all
select 111, -135, 'Work', 2 union all
select 222, -98, 'Home',  2 union all
select 222, -95, 'Work',  1 union all
select 222, -103, 'Work', 2
) ,
tabG(id, maxS) as
(
   select id, max(sig) as sig from tab group by id
)
select g.*, p.* from tabG g
cross apply ( select  top(1) * from tab t where t.id=g.id order by t.sig desc ) p
2
han

自己結合を使用して実行できます

SELECT  T1.ID,T1.Signal,T2.Station,T2.OwnerID
FROM (select ID,max(Signal) as Signal from mytable group by ID) T1
LEFT JOIN mytable T2
ON T1.ID=T2.ID and T1.Signal=T2.Signal;

または、次のクエリを使用することもできます

SELECT t0.ID,t0.Signal,t0.Station,t0.OwnerID 
FROM mytable t0 
LEFT JOIN mytable t1 ON t0.ID=t1.ID AND t1.Signal>t0.Signal 
WHERE t1.ID IS NULL;
1
minhas23
_WITH q AS
         (
         SELECT  c.*, ROW_NUMBER() OVER (PARTITION BY id ORDER BY signal DESC) rn
         FROM    mytable
         )
SELECT   *
FROM     q
WHERE    rn = 1
_

これにより、特定のIDに対してMAX(signal)が重複している場合でも、1行が返されます。

_(id, signal)_にインデックスを付けると、このクエリが大幅に改善されます。

1
Quassnoi
select a.id, b.signal, a.station, a.owner from 
mytable a
join 
(SELECT ID, MAX(Signal) as Signal FROM mytable GROUP BY ID) b
on a.id = b.id AND a.Signal = b.Signal 
0
HLGEM
 SELECT * FROM StatusTable 
 WHERE Signal IN(
 SELECT A.maxSignal FROM 
(
 SELECT ID、MAX(Signal)AS maxSignal 
 FROM StatusTable 
 GROUP BY ID 
)AS A 
); 
0