database-design - MongoDB Schema Design - 许多小文档还是更

背景
我正在对从我们的 RDBMS 数据库到 MongoDB 的转换进行原型(prototype)设计。在进行非规范化时，似乎我有两种选择，一种会导致许多(数百万)个小文档，另一种会导致更少(数十万)个大文档。

如果我可以将其提炼成一个简单的类比，这将是具有较少客户文档的集合之间的区别(在 Java 中):

class Customer {
    private String name;
    private Address address;
    // each CreditCard has hundreds of Payment instances
    private Set<CreditCard> creditCards;
}

或者一个包含很多很多这样的付款文档的集合:

class Payment {
    private Customer customer;
    private CreditCard creditCard;
    private Date payDate;
    private float payAmount;
}

问题
MongoDB 的设计是偏爱很多很多小文档还是更少的大文档？答案是否主要取决于我计划运行的查询？ (即客户 X 有多少张信用卡？vs 所有客户上个月支付的平均金额是多少？)

我环顾四周，但没有偶然发现任何可以帮助我回答问题的 MongoDB 架构最佳实践。

最佳答案

您肯定需要针对正在执行的查询进行优化。

根据您的描述，这是我的最佳猜测。

您可能想知道每个客户的所有信用卡，因此请在客户对象中保留一个数组。您可能还希望每次付款都有一个客户引用。这将使支付文档相对较小。

支付对象将自动拥有自己的 ID 和索引。您可能还想在客户引用上添加一个索引。

这将允许您快速搜索客户付款，而无需每次都存储整个客户对象。

如果您想回答诸如“所有客户上个月支付的平均金额是多少”之类的问题，您将需要为任何大型数据集提供 map /减少。您没有“实时”获得此响应。您会发现存储对 Customer 的“引用”对于这些 map-reduce 来说可能已经足够了。

所以直接回答你的问题:MongoDB 是设计成偏爱很多很多小文档还是更少的大文档？

MongoDB 旨在非常快速地找到索引条目。 MongoDB 非常擅长大海捞针。 MongoDB 不是非常善于在大海捞针中找到大部分。因此，围绕您最常见的用例构建数据，并为罕见的用例编写 map/reduce 作业。

关于database-design - MongoDB Schema Design - 许多小文档还是更少的大文档？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3038703/

相关文章：

node.js - 编译 Mongoose 后无法覆盖模型

mongodb - 将 mongo 查询的输出重定向到 csv 文件

node.js - 在 Mongoose 中将两个 OR 查询与 AND 组合

mongodb - 面向列的 NoSQL 与面向文档的 NoSQL 有何不同？

MongoDB - 分页

node.js - 如何保护 Mongoose/MongoDB 中的密码字段，以便在填充集合时它不会

mongodb - 有没有一种简单的方法可以从 meteor 部署的应用程序中导出数据？

linux - MongoDB GUI 客户端(跨平台或 Linux)

mongodb - Mongoose 唯一索引不起作用!

javascript - 如何使用 Mongoose 从集合中删除所有文档？