在 MongoDB 聚合框架中,我希望在对象(即 JSON 集合)上使用 $unwind 运算符。看起来不像是 possible ,有解决方法吗?有计划实现吗?
例如,从聚合 documentation 中获取文章集合.假设有一个附加字段“ratings”,它是来自 user -> rating 的映射。你能计算出每个用户的平均评分吗?
除此之外,我对聚合框架非常满意。
更新:这是我每个请求的 JSON 集合的简化版本。我正在存储基因组数据。我不能真正使基因型成为一个数组,因为最常见的查找是获取随机人的基因型。
variants: [
{
name: 'variant1',
genotypes: {
person1: 2,
person2: 5,
person3: 7,
}
},
{
name: 'variant2',
genotypes: {
person1: 3,
person2: 3,
person3: 2,
}
}
]
最佳答案
不可能使用聚合框架进行您所描述的计算类型 - 而且它不是,因为没有非数组的 $unwind
方法。即使 person:value 对象是数组中的文档,$unwind
也无济于事。
“分组依据”功能(无论是在 MongoDB 中还是在任何关系数据库中)都是根据字段或列的值完成的。我们按字段值分组,并根据另一个字段的值求和/平均/等。
简单示例是您建议的变体,评分字段添加到示例文章集合中,但不是从用户到评分的映射,而是像这样的数组:
{ title : title of article", ...
ratings: [
{ voter: "user1", score: 5 },
{ voter: "user2", score: 8 },
{ voter: "user3", score: 7 }
]
}
现在您可以将其汇总为:
[ {$unwind: "$ratings"},
{$group : {_id : "$ratings.voter", averageScore: {$avg:"$ratings.score"} } }
]
但这个示例的结构如您所描述的那样:
{ title : title of article", ...
ratings: {
user1: 5,
user2: 8,
user3: 7
}
}
甚至这个:
{ title : title of article", ...
ratings: [
{ user1: 5 },
{ user2: 8 },
{ user3: 7 }
]
}
即使你可以 $unwind
这个,这里也没有什么可以聚合的。除非您知道所有可能的 key (用户)的完整列表,否则您无法对此做太多事情。 [*]
与您所拥有的类似的关系数据库架构:
CREATE TABLE T (
user1: integer,
user2: integer,
user3: integer
...
);
我们不会这样做,而是这样做:
CREATE TABLE T (
username: varchar(32),
score: integer
);
现在我们使用 SQL 进行聚合:
select username, avg(score) from T group by username;
有一个对 MongoDB 的增强请求,可能允许您将来在聚合框架中执行此操作 - 将值投影到键的能力,反之亦然。同时,总是有 map/reduce。
[*] 如果您知道所有唯一键(您可以使用类似于 this 的方法找到所有唯一键),则有一种复杂的方法可以执行此操作,但是如果您知道所有键,则最好运行db.articles.find({"ratings.user1":{$exists:true}},{_id:0,"ratings.user1":1})
形式的查询序列userX 将返回他们的所有评分,您可以简单地对它们进行求和和平均,而不是进行聚合框架所需的非常复杂的投影。
https://stackoverflow.com/questions/11189243/