web-dev-qa-db-ja.com

MongoDb集計日付別グループ

「foo」というコレクションのタイムスタンプでグループ化しようとしています{_id、TimeStamp}

db.foos.aggregate(
[
   {$group : { _id : new Date (Date.UTC({ $year : '$TimeStamp' },{ $month : '$TimeStamp' },{$dayOfMonth : '$TimeStamp'}))       }}
])

多くの日付が必要ですが、結果は1つの日付にすぎません。私が使用しているデータは正しいです(1970を除く多くのfooと異なる日付があります)。日付の解析に問題がありますが、まだ解決できません。

{
    "result" : [ 
        {
            "_id" : ISODate("1970-01-01T00:00:00.000Z")
        }
    ],
    "ok" : 1
}

これを試しました:

db.foos.aggregate(
[
   {$group : { _id : { year : { $year : '$TimeStamp' }, month : { $month : '$TimeStamp' }, day : {$dayOfMonth : '$TimeStamp'} }, count : { $sum : 1 }       }},
   {$project : { parsedDate : new Date('$_id.year', '$_id.month', '$_id.day') , count : 1, _id : 0} }
])

結果:

uncaught exception: aggregate failed: {
    "errmsg" : "exception: disallowed field type Date in object expression (at 'parsedDate')",
    "code" : 15992,
    "ok" : 0
}

そしてそれは:

db.foos.aggregate(
[
   {$group : { _id : { year : { $year : '$TimeStamp' }, month : { $month : '$TimeStamp' }, day : {$dayOfMonth : '$TimeStamp'} }, count : { $sum : 1 }       }},
   {$project : { parsedDate : Date.UTC('$_id.year', '$_id.month', '$_id.day') , count : 1, _id : 0} }
])

結果に日付が表示されない

{
    "result" : [ 
        {
            "count" : 412
        }, 
        {
            "count" : 1702
        }, 
        {
            "count" : 422
        }
    ],
    "ok" : 1
}
12
jackie

最終出力でISODateタイプとして日付を使用するかどうかによって異なります。その場合は、次の2つのいずれかを実行できます。

  1. 抽出$year$month$dayOfMonthタイムスタンプから、それらから新しい日付を再構築します(すでにそれを試みていますが、集計フレームワークでは機能しない構文を使用しています)。

  2. 元のTimestampのタイプがISODate()の場合は、日付の計算を行って、タイムスタンプから時、分、秒、ミリ秒を差し引き、その日に「丸められた」新しい日付を取得できます。

ここでは2の例 があります。

以下はその方法です。1.私はすべての日付が今年であると仮定していますが、最も古い日付に合わせて簡単に計算を調整できます。

project1={$project:{_id:0, 
                   y:{$subtract:[{$year:"$TimeStamp"}, 2013]},
                   d:{$subtract:[{$dayOfYear:"$TimeStamp"},1]}, 
                   TimeStamp:1, 
                   jan1:{$literal:new ISODate("2013-01-01T00:00:00")}
         } };
project2={$project:{tsDate:{$add:[
                       "$jan1",
                       {$multiply:["$y", 365*24*60*60*1000]},
                       {$multiply:["$d", 24*60*60*1000]}
         ] } } };

サンプルデータ:

db.foos.find({},{_id:0,TimeStamp:1})
{ "TimeStamp" : ISODate("2013-11-13T19:15:05.600Z") }
{ "TimeStamp" : ISODate("2014-02-01T10:00:00Z") }

集計結果:

> db.foos.aggregate(project1, project2)
{ "tsDate" : ISODate("2013-11-13T00:00:00Z") }
{ "tsDate" : ISODate("2014-02-01T00:00:00Z") }
12
Asya Kamsky
_db.foos.aggregate(
    [   
        {   $project : { day : {$substr: ["$TimeStamp", 0, 10] }}},        
        {   $group   : { _id : "$day",  number : { $sum : 1 }}},
        {   $sort    : { _id : 1 }}        
    ]
)
_

日付によるグループ化は、集計フレームワークの2つのステップで実行できます。ソートが必要な場合は、結果をソートするために追加の3番目のステップが必要です。

  1. _$project_と_$substr_の組み合わせは、各ドキュメントからISODateオブジェクトの最初の10文字(YYYY:MM:DD)を取得します(結果は、フィールド「_id」と「day」を持つドキュメントのコレクションです。 );
  2. _$group_は日ごとにグループ化し、一致するドキュメントごとに数値1を追加(合計)します。
  3. _$sort_前の集計ステップからの日である "_id"の昇順-ソート結果が必要な場合、これはオプションです。

このソリューションはISODateオブジェクトをオンザフライで文字列オブジェクトに変換するため、db.Twitter.ensureIndex( { TimeStamp: 1 } )のようなインデックスを利用できません。大規模なコレクション(何百万ものドキュメント)の場合、これはパフォーマンスのボトルネックになる可能性があるため、より洗練されたアプローチを使用する必要があります。

18
petra

これは私のプロジェクトの1つで使用しています:

   collection.aggregate(
      // group results by date
      {$group : {
        _id : { date : "$date" }
        // do whatever you want here, like $Push, $sum...
      }},

      // _id is the date
      {$sort : { _id : -1}},                        
      {$orderby: { _id : -1 }})
    .toArray()

$ dateはmongoのDateオブジェクトです。日付で索引付けされた結果が得られます。

0
nha