web-dev-qa-db-ja.com

時間範囲内で5分の間隔にグループ化する

私がやりたいmySQLコマンドにはいくつかの困難があります。

SELECT a.timestamp, name, count(b.name) 
FROM time a, id b 
WHERE a.user = b.user
  AND a.id = b.id
  AND b.name = 'John'
  AND a.timestamp BETWEEN '2010-11-16 10:30:00' AND '2010-11-16 11:00:00' 
GROUP BY a.timestamp

これは私の現在の出力ステートメントです。

timestamp            name  count(b.name)
-------------------  ----  -------------
2010-11-16 10:32:22  John  2
2010-11-16 10:35:12  John  7
2010-11-16 10:36:34  John  1
2010-11-16 10:37:45  John  2
2010-11-16 10:48:26  John  8
2010-11-16 10:55:00  John  9
2010-11-16 10:58:08  John  2

5分間隔の結果にグループ化するにはどうすればよいですか?

出力を次のようにしたい

timestamp            name  count(b.name)
-------------------  ----  -------------
2010-11-16 10:30:00  John  2
2010-11-16 10:35:00  John  10
2010-11-16 10:40:00  John  0
2010-11-16 10:45:00  John  8
2010-11-16 10:50:00  John  0
2010-11-16 10:55:00  John  11 
76
sky

これはすべての間隔で機能します。

PostgreSQL

SELECT
    TIMESTAMP WITH TIME ZONE 'Epoch' +
    INTERVAL '1 second' * round(extract('Epoch' from timestamp) / 300) * 300 as timestamp,
    name,
    count(b.name)
FROM time a, id 
WHERE …
GROUP BY 
round(extract('Epoch' from timestamp) / 300), name


MySQL

SELECT
    timestamp,  -- not sure about that
    name,
    count(b.name)
FROM time a, id 
WHERE …
GROUP BY 
UNIX_TIMESTAMP(timestamp) DIV 300, name
125
boecko

Round(../ 300)の代わりにGROUP BY UNIX_TIMESTAMP(time_stamp) DIV 300を使用する必要があります。これは、一部のレコードが2つのグループ化された結果セットにカウントされることがわかったためです。

28
pHiL

postgresの場合、使用する方が簡単で正確であることがわかりました

date_trunc

次のような関数

select name, sum(count), date_trunc('minute',timestamp) as timestamp
FROM table
WHERE xxx
GROUP BY name,date_trunc('minute',timestamp)
ORDER BY timestamp

Date_truncには、「分」、「時間」、「日」などのさまざまな解像度を指定できます。

27
Scott Persinger

私は同じ問題に出くわしました。

Epochを秒単位で分で割ってから、丸めたり、床を使って残りを乗せたりするだけで、任意の分間隔でグループ化するのは簡単であることがわかりました。したがって、5分の間隔を取得する場合は、300秒を使用します。

SELECT COUNT(*) cnt, 
to_timestamp(floor((extract('Epoch' from timestamp_column) / 300 )) * 300) 
AT TIME ZONE 'UTC' as interval_alias
FROM TABLE_NAME GROUP BY interval_alias
 </ code>
 interval_alias cnt 
 ------------------- ---- 
 2010-11-16 10:30:00 2 
 2010-11-16 10:35:00 10 
 2010-11-16 10:45:00 8 
 2010-11-16 10:55:00 11 

これにより、選択した分間隔でデータが正しくグループ化されます。ただし、データが含まれていない間隔は返されません。これらの空の間隔を取得するには、関数 generate_series を使用できます。

SELECT generate_series(MIN(date_trunc('hour',timestamp_column)),
max(date_trunc('minute',timestamp_column)),'5m') as interval_alias FROM 
TABLE_NAME
 </ code>

結果:

 interval_alias 
 ------------------- 
 2010-11-16 10:30:00 
 2010-11-16 10:35:00 
 2010-11-16 10:40:00 
 2010-11-16 10:45:00 
 2010-11-16 10:50:00 
 2010-11-16 10:55:00 

出現回数ゼロの間隔で結果を取得するには、両方の結果セットを外部結合するだけです

SELECT series.minute as interval,  coalesce(cnt.amnt,0) as count from 
   (
   SELECT count(*) amnt,
   to_timestamp(floor((extract('Epoch' from timestamp_column) / 300 )) * 300)
   AT TIME ZONE 'UTC' as interval_alias
   from TABLE_NAME  group by interval_alias
   ) cnt

RIGHT JOIN 
   (    
   SELECT generate_series(min(date_trunc('hour',timestamp_column)),
   max(date_trunc('minute',timestamp_column)),'5m') as minute from TABLE_NAME 
   ) series
 </ code>

series.minute = cnt.interval_aliasで

最終結果には、値がないものも含めて、5分間隔のすべてのシリーズが含まれます。

間隔カウント
 ------------------- ---- 
 2010-11-16 10:30:00 2 
 2010-11-16 10:35:00 10 
 2010-11-16 10:40:00 0 
 2010-11-16 10:45:00 8 
 2010-11-16 10:50:00 0 
 2010-11-16 10:55:00 11 

Generate_seriesの最後のパラメーターを調整することにより、間隔を簡単に変更できます。この場合、 '5m'を使用しますが、任意の間隔にすることもできます。

26
Nestor Martinez

クエリは次のようになります。

SELECT 
  DATE_FORMAT(
    MIN(timestamp),
    '%d/%m/%Y %H:%i:00'
  ) AS tmstamp,
  name,
  COUNT(id) AS cnt 
FROM
  table
GROUP BY ROUND(UNIX_TIMESTAMP(timestamp) / 300), name
10
WASD42

タイムスタンプをymd:HMに分割し、DIV 5を使用して分を5分のビンに分割する必要があります。

select year(a.timestamp), 
       month(a.timestamp), 
       hour(a.timestamp), 
       minute(a.timestamp) DIV 5,
       name, 
       count(b.name)
FROM time a, id b
WHERE a.user = b.user AND a.id = b.id AND b.name = 'John' 
      AND a.timestamp BETWEEN '2010-11-16 10:30:00' AND '2010-11-16 11:00:00'
GROUP BY year(a.timestamp), 
       month(a.timestamp), 
       hour(a.timestamp), 
       minute(a.timestamp) DIV 12

...そして、クライアントコードの出力を変更して、好みの方法で表示します。または、必要に応じて、個別の列を取得する代わりに、sql concat演算子を使用して日付文字列全体を構築できます。

select concat(year(a.timestamp), "-", month(a.timestamp), "-" ,day(a.timestamp), 
       " " , lpad(hour(a.timestamp),2,'0'), ":", 
       lpad((minute(a.timestamp) DIV 5) * 5, 2, '0'))

...そしてその上でグループ化する

4
Bill Dueber

これはどう:

select 
    from_unixtime(unix_timestamp(timestamp) - unix_timestamp(timestamp) mod 300) as ts,  
    sum(value)
from group_interval 
group by ts 
order by ts
;
1
mac13k

まだ必要かどうかわかりません。

SELECT FROM_UNIXTIME(FLOOR((UNIX_TIMESTAMP(timestamp))/300)*300) AS t,timestamp,count(1) as c from users GROUP BY t ORDER BY t;

2016-10-29 19:35:00 | 2016-10-29 19:35:50 | 4 |

2016-10-29 19:40:00 | 2016-10-29 19:40:37 | 5 |

2016-10-29 19:45:00 | 2016-10-29 19:45:09 | 6 |

2016-10-29 19:50:00 | 2016-10-29 19:51:14 | 4 |

2016-10-29 19:55:00 | 2016-10-29 19:56:17 | 1 |

1
user7088930

MySQLを使用した場合、おそらく正しいクエリは次のとおりであることがわかりました。

SELECT SUBSTRING( FROM_UNIXTIME( CEILING( timestamp /300 ) *300,  
                                 '%Y-%m-%d %H:%i:%S' ) , 1, 19 ) AS ts_CEILING,
SUM(value)
FROM group_interval
GROUP BY SUBSTRING( FROM_UNIXTIME( CEILING( timestamp /300 ) *300,  
                                   '%Y-%m-%d %H:%i:%S' ) , 1, 19 )
ORDER BY SUBSTRING( FROM_UNIXTIME( CEILING( timestamp /300 ) *300,  
                                   '%Y-%m-%d %H:%i:%S' ) , 1, 19 ) DESC

どう考えているか教えてください。

0
EBAH
select 
CONCAT(CAST(CREATEDATE AS DATE),' ',datepart(hour,createdate),':',ROUNd(CAST((CAST((CAST(DATEPART(MINUTE,CREATEDATE) AS DECIMAL (18,4)))/5 AS INT)) AS DECIMAL (18,4))/12*60,2)) AS '5MINDATE'
,count(something)
from TABLE
group by CONCAT(CAST(CREATEDATE AS DATE),' ',datepart(hour,createdate),':',ROUNd(CAST((CAST((CAST(DATEPART(MINUTE,CREATEDATE) AS DECIMAL (18,4)))/5 AS INT)) AS DECIMAL (18,4))/12*60,2))
0
gerrit bosua