私は次の形式のコレクションを持っているmongoDB
を使用しています。
{"id" : 1 , name : x ttm : 23 , val : 5 }
{"id" : 1 , name : x ttm : 34 , val : 1 }
{"id" : 1 , name : x ttm : 24 , val : 2 }
{"id" : 2 , name : x ttm : 56 , val : 3 }
{"id" : 2 , name : x ttm : 76 , val : 3 }
{"id" : 3 , name : x ttm : 54 , val : 7 }
そのコレクションでは、次のような降順でレコードを取得するようにクエリを実行しました。
db.foo.find({"id" : {"$in" : [1,2,3]}}).sort(ttm : -1).limit(3)
しかし、同じid = 1
の2つのレコードを提供し、id
ごとに1つのレコードを提供するようなレコードが必要です。
Mongodbでは可能ですか?
Mongodbにはdistinct
コマンドがあり、クエリと組み合わせて使用できます。ただし、これはあなたが名前を付けた特定のキーの値の個別のリストを返すだけだと思います(つまり、あなたの場合は、id値のみが返されます)ドキュメント全体が必要です-代わりにMapReduceが必要になる場合があります。
個別のドキュメント: http://www.mongodb.org/display/DOCS/Aggregation#Aggregation-Distinct
集約を使用します。次のようにできます:
db.test.aggregate([
// each Object is an aggregation.
{
$group: {
originalId: {$first: '$_id'}, // Hold onto original ID.
_id: '$id', // Set the unique identifier
val: {$first: '$val'},
name: {$first: '$name'},
ttm: {$first: '$ttm'}
}
}, {
// this receives the output from the first aggregation.
// So the (originally) non-unique 'id' field is now
// present as the _id field. We want to rename it.
$project:{
_id : '$originalId', // Restore original ID.
id : '$_id', //
val : '$val',
name: '$name',
ttm : '$ttm'
}
}
])
これはvery fast ... 100,000文書のテストDBで〜90msです。
例:
db.test.find()
// { "_id" : ObjectId("55fb595b241fee91ac4cd881"), "id" : 1, "name" : "x", "ttm" : 23, "val" : 5 }
// { "_id" : ObjectId("55fb596d241fee91ac4cd882"), "id" : 1, "name" : "x", "ttm" : 34, "val" : 1 }
// { "_id" : ObjectId("55fb59c8241fee91ac4cd883"), "id" : 1, "name" : "x", "ttm" : 24, "val" : 2 }
// { "_id" : ObjectId("55fb59d9241fee91ac4cd884"), "id" : 2, "name" : "x", "ttm" : 56, "val" : 3 }
// { "_id" : ObjectId("55fb59e7241fee91ac4cd885"), "id" : 2, "name" : "x", "ttm" : 76, "val" : 3 }
// { "_id" : ObjectId("55fb59f9241fee91ac4cd886"), "id" : 3, "name" : "x", "ttm" : 54, "val" : 7 }
db.test.aggregate(/* from first code snippet */)
// output
{
"result" : [
{
"_id" : ObjectId("55fb59f9241fee91ac4cd886"),
"val" : 7,
"name" : "x",
"ttm" : 54,
"id" : 3
},
{
"_id" : ObjectId("55fb59d9241fee91ac4cd884"),
"val" : 3,
"name" : "x",
"ttm" : 56,
"id" : 2
},
{
"_id" : ObjectId("55fb595b241fee91ac4cd881"),
"val" : 5,
"name" : "x",
"ttm" : 23,
"id" : 1
}
],
"ok" : 1
}
長所:ほぼ間違いなく最速の方法です。
短所:複雑なAggregation APIの使用を伴います。また、ドキュメントの元のスキーマと密に結合されています。ただし、これを一般化することは可能かもしれません。
問題は、3つの一致するレコードを1つに抽出して、一致する結果を選択する方法についてクエリにロジックを提供しないことです。
オプションは、基本的に、ある種の集約ロジックを指定する(たとえば、各列の最大値または最小値を選択する)か、選択クエリを実行して、区別したいフィールドのみを選択することです。
querymongo.com は、これらの個別のクエリを(SQLからMongoDBに)変換するのに適しています。
たとえば、次のSQL:
SELECT DISTINCT columnA FROM collection WHERE columnA > 5
このMongoDBとして返されます:
db.runCommand({
"distinct": "collection",
"query": {
"columnA": {
"$gt": 5
}
},
"key": "columnA"
});
このような集計を使用できると思います
collection.aggregate({
$group : {
"_id" : "$id",
"docs" : {
$first : {
"name" : "$name",
"ttm" : "$ttm",
"val" : "$val",
}
}
}
});
Javascriptを使用してファイルに明確な結果を書きたい場合...これがあなたのやり方です
cursor = db.myColl.find({'fieldName':'fieldValue'})
var Arr = new Array();
var count = 0;
cursor.forEach(
function(x) {
var temp = x.id;
var index = Arr.indexOf(temp);
if(index==-1)
{
printjson(x.id);
Arr[count] = temp;
count++;
}
})