私のMongoDBスキーマが次のようになっているとしましょう:
{car_id: "...", owner_id: "..."}
これは多対多の関係です。たとえば、データは次のようになります。
+-----+----------+--------+
| _id | owner_id | car_id |
+-----+----------+--------+
| 1 | 1 | 1 |
| 2 | 1 | 2 |
| 3 | 1 | 3 |
| 4 | 2 | 1 |
| 5 | 2 | 2 |
| 6 | 3 | 4 |
| 7 | 3 | 5 |
| 8 | 3 | 6 |
| 9 | 3 | 7 |
| 10 | 1 | 1 | <-- not unique
+-----+----------+--------+
各所有者が所有する車の数を取得したい。 SQLでは、これは次のようになります。
SELECT owner_id, COUNT(*) AS cars_owned
FROM (SELECT owner_id FROM car_owners GROUP BY owner_id, car_id) AS t
GROUP BY owner_id;
この場合、結果は次のようになります。
+----------+------------+
| owner_id | cars_owned |
+----------+------------+
| 1 | 3 |
| 2 | 2 |
| 3 | 4 |
+----------+------------+
集約フレームワークを使用してMongoDBを使用してこれと同じことをどのように達成できますか?
潜在的な重複に対応するには、2つの$group
操作を使用する必要があります。
db.test.aggregate([
{ $group: {
_id: { owner_id: '$owner_id', car_id: '$car_id' }
}},
{ $group: {
_id: '$_id.owner_id',
cars_owned: { $sum: 1 }
}},
{ $project: {
_id: 0,
owner_id: '$_id',
cars_owned: 1
}}]
, function(err, result){
console.log(result);
}
);
次の形式で結果を返します。
[ { cars_owned: 2, owner_id: 10 },
{ cars_owned: 1, owner_id: 11 } ]
$group
は、コマンドによるSQLグループに似ています。以下の例では、会社が設立された年に基づいて会社を集約します。そして、各企業の従業員の平均数を計算します。
db.companies.aggregate([{
$group: {
_id: {
founded_year: "$founded_year"
},
average_number_of_employees: {
$avg: "$number_of_employees"
}
}
}, {
$sort: {
average_number_of_employees: -1
}
}
])
この集約パイプラインには2つのステージがあります
$group
$sort
$group
ステージの基本は、ドキュメントの一部として指定する_id
フィールドです。これは、arrogation framework構文の非常に厳密な解釈を使用する$group
演算子自体の値です。 _id
は、グループステージが表示するドキュメントを整理するために使用するものを定義する方法、制御する方法、調整する方法です。
以下のクエリは、$sum
演算子を使用して、企業と人々の関係を見つけます。
db.companies.aggregate([{
$match: {
"relationships.person": {
$ne: null
}
}
}, {
$project: {
relationships: 1,
_id: 0
}
}, {
$unwind: "$relationships"
}, {
$group: {
_id: "$relationships.person",
count: {
$sum: 1
}
}
}, {
$sort: {
count: -1
}
}])