mongodb - $unwind 聚合框架中的对象

在 MongoDB 聚合框架中,我希望在对象(即 JSON 集合)上使用 $unwind 运算符。看起来不像是 possible ,有解决方法吗?有计划实现吗?

例如,从聚合 documentation 中获取文章集合.假设有一个附加字段“ratings”,它是来自 user -> rating 的映射。你能计算出每个用户的平均评分吗?

除此之外,我对聚合框架非常满意。

更新:这是我每个请求的 JSON 集合的简化版本。我正在存储基因组数据。我不能真正使基因型成为一个数组,因为最常见的查找是获取随机人的基因型。

variants: [

    {
        name: 'variant1', 
        genotypes: {

            person1: 2,
            person2: 5,
            person3: 7,

        }
    }, 

    {
        name: 'variant2', 
        genotypes: {

            person1: 3,
            person2: 3,
            person3: 2,

        }
    }

]

最佳答案

不可能使用聚合框架进行您所描述的计算类型 - 而且它不是,因为没有非数组的 $unwind 方法。即使 person:value 对象是数组中的文档,$unwind 也无济于事。

“分组依据”功能(无论是在 MongoDB 中还是在任何关系数据库中)都是根据字段或列的值完成的。我们按字段值分组,并根据另一个字段的值求和/平均/等。

简单示例是您建议的变体,评分字段添加到示例文章集合中,但不是从用户到评分的映射,而是像这样的数组:

{ title : title of article", ...
  ratings: [
         { voter: "user1", score: 5 },
         { voter: "user2", score: 8 },
         { voter: "user3", score: 7 }
  ]
}

现在您可以将其汇总为:

[ {$unwind: "$ratings"},
  {$group : {_id : "$ratings.voter", averageScore: {$avg:"$ratings.score"} } } 
]

但这个示例的结构如您所描述的那样:

{ title : title of article", ...
  ratings: {
         user1: 5,
         user2: 8,
         user3: 7
  }
}

甚至这个:

{ title : title of article", ...
  ratings: [
         { user1: 5 },
         { user2: 8 },
         { user3: 7 }
  ]
}

即使你可以 $unwind 这个,这里也没有什么可以聚合的。除非您知道所有可能的 key (用户)的完整列表,否则您无法对此做太多事情。 [*]

与您所拥有的类似的关系数据库架构:

CREATE TABLE T (
   user1: integer,
   user2: integer,
   user3: integer
   ...
);

我们不会这样做,而是这样做:

CREATE TABLE T (
   username: varchar(32),
   score: integer
);

现在我们使用 SQL 进行聚合:

select username, avg(score) from T group by username;

有一个对 MongoDB 的增强请求,可能允许您将来在聚合框架中执行此操作 - 将值投影到键的能力,反之亦然。同时,总是有 map/reduce。

[*] 如果您知道所有唯一键(您可以使用类似于 this 的方法找到所有唯一键),则有一种复杂的方法可以执行此操作,但是如果您知道所有键,则最好运行db.articles.find({"ratings.user1":{$exists:true}},{_id:0,"ratings.user1":1}) 形式的查询序列userX 将返回他们的所有评分,您可以简单地对它们进行求和和平均,而不是进行聚合框架所需的非常复杂的投影。

https://stackoverflow.com/questions/11189243/

相关文章:

mongodb - 在 MongoDB shell 查询中获取 "data from collect

python - 文档中的 Mongoengine creation_time 属性

mongodb - Mongoose - 在 ObjectId 数组上使用 Populate

mongodb - 图形数据库与文档数据库与三重存储

regex - 如何使用 mongoose find 获取包含部分字符串的所有值?

mongodb - 如何使用 MongoDB 进行报告?

c# - 序列化 Mongo ObjectId 时出现 JSON.NET 转换错误

ruby - 获取 MongoDB 中列的最高值

regex - MongoDB,通过正则表达式对索引字段的查询性能

mongodb - 无法使用 --db 创建备份 mongodump。身份验证失败