web-dev-qa-db-ja.com

MySQLクエリ、MAX()+ GROUP BY

Daft SQLの質問。私はそのようなテーブルを持っています(「pid」は自動インクリメントプライマリ列です)

CREATE TABLE theTable (
    `pid` INT UNSIGNED PRIMARY KEY AUTO_INCREMENT,
    `timestamp` TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    `cost` INT UNSIGNED NOT NULL,
    `rid` INT NOT NULL,
) Engine=InnoDB;

実際のテーブルデータ:

INSERT INTO theTable (`pid`, `timestamp`, `cost`, `rid`)
VALUES
  (1, '2011-04-14 01:05:07', 1122, 1),
  (2, '2011-04-14 00:05:07', 2233, 1),
  (3, '2011-04-14 01:05:41', 4455, 2),
  (4, '2011-04-14 01:01:11', 5566, 2),
  (5, '2011-04-14 01:06:06', 345, 1),
  (6, '2011-04-13 22:06:06', 543, 2),
  (7, '2011-04-14 01:14:14', 5435, 3),
  (8, '2011-04-14 01:10:13', 6767, 3)
;

各ridの最新の行のPIDを取得したい(一意のRIDごとに1つの結果)。サンプルデータについては、次のようにします。

pid | MAX(timestamp)      | rid
-----------------------------------
5   | 2011-04-14 01:06:06 | 1
3   | 2011-04-14 01:05:41 | 2
7   | 2011-04-14 01:14:14 | 3

私は次のクエリを実行しようとしました:

SELECT MAX(timestamp),rid,pid FROM theTable GROUP BY rid

そして私は得る:

max(timestamp)     ; rid; pid
----------------------------
2011-04-14 01:06:06; 1  ; 1
2011-04-14 01:05:41; 2  ; 3
2011-04-14 01:14:14; 3  ; 7

返されるPIDは常にRIDの最初のPIDの発生です(行/ pid 1は最初にrid 1が使用され、行/ pid 3は最初にRID 2が使用され、行/ pid 7は最初にrid 3が使用されます)。各ridの最大タイムスタンプを返しますが、pidは元のテーブルのタイムスタンプのpidではありません。どんなクエリで探している結果が得られますか?

27
codinghands

(PostgreSQL 9.somethingでテスト済み)

RIDとタイムスタンプを特定します。

select rid, max(timestamp) as ts
from test
group by rid;

1   2011-04-14 18:46:00
2   2011-04-14 14:59:00

参加してください。

select test.pid, test.cost, test.timestamp, test.rid
from test
inner join 
    (select rid, max(timestamp) as ts
    from test
    group by rid) maxt
on (test.rid = maxt.rid and test.timestamp = maxt.ts)
select *
from (
    select `pid`, `timestamp`, `cost`, `rid`
    from theTable 
    order by `timestamp` desc
) as mynewtable
group by mynewtable.`rid`
order by mynewtable.`timestamp`

私が助けたことを願っています!

7
anzize
SELECT t.pid, t.cost, to.timestamp, t.rid
FROM test as t
JOIN (
    SELECT rid, max(tempstamp) AS maxtimestamp
    FROM test GROUP BY rid
) AS tmax
    ON t.pid = tmax.pid and t.timestamp = tmax.maxtimestamp
4
dkretz

Ridとtimestampにインデックスを作成しました。

SELECT test.pid, test.cost, test.timestamp, test.rid
FROM theTable AS test
LEFT JOIN theTable maxt 
ON maxt.rid = test.rid
AND maxt.timestamp > test.timestamp
WHERE maxt.rid IS NULL 

行0〜2を表示(合計3、クエリに0.0104秒かかりました)

このメソッドは、theTable(テスト)からすべての必要な値を選択し、同じRIDを持つテスト上のタイムスタンプよりも高いすべてのタイムスタンプでそれ自体を結合(最大)します。タイムスタンプが既にテストで最高のタイムスタンプである場合、maxtに一致するものはありません-これが探しているものです-maxtの値はNULLになります。ここで、WHERE句maxt.rid IS NULLまたはmaxtの他の列を使用します。

2
Caio Iglesias

JOINを回避する場合は、次を使用できます。

SELECT pid, rid FROM theTable t1 WHERE t1.pid IN ( SELECT MAX(t2.pid) FROM theTable t2 GROUP BY t2.rid);
0

次のようなサブクエリを使用することもできます。

SELECT ( SELECT MIN(t2.pid)
         FROM test t2
         WHERE t2.rid = t.rid
           AND t2.timestamp = maxtimestamp
       ) AS pid 
     , MAX(t.timestamp) AS maxtimestamp
     , t.rid
FROM test t
GROUP BY t.rid

ただし、この方法では、表示された列などにcostを含める場合、もう1つのサブクエリが必要になります。

したがって、group byjoinがより良い解決策です。

0
ypercubeᵀᴹ