关闭。这个问题是opinion-based .它目前不接受答案。
想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题.
6年前关闭。
Improve this question
这个问题是关于在深入研究实验和实现的细节之前做出架构选择。这是关于 Elasticsearch 与 Elasticsearch 在可扩展性和性能方面的适用性。 MongoDB,出于某种特定目的。
假设两者都存储具有字段和值的数据对象,并允许查询该对象主体。因此,大概根据选择的临时字段过滤掉对象的子集,这两者都适合。
我的应用程序将围绕根据标准选择对象。
它会通过同时过滤多个字段来选择对象,换句话说,它的查询过滤标准通常包含 1 到 5 个字段,在某些情况下可能更多。而选择作为过滤器的字段将是大量字段的子集。想象一下现有的大约 20 个字段名称,每个查询都是尝试通过这 20 个字段中的几个字段过滤对象(存在的总字段名称可以少于或多于 20 个,我只是用这个数字来说明字段到在每个离散查询中用作过滤器的字段)。过滤可以通过所选字段的存在以及字段值,例如过滤掉具有场A,场B在x和y之间,场C等于w的对象。
我的应用程序将不断进行这种过滤,而在任何时候用于过滤的字段方面都没有或几乎没有恒定不变。也许在elasticsearch中需要定义索引,但也许即使没有索引,速度也与MongoDB不相上下。
根据进入 store 的数据,没有关于它的特殊细节......对象在插入后几乎不会改变。也许需要删除旧对象,我想假设两个数据存储都支持在内部或通过应用程序查询的过期删除内容。 (不太常见的是,也需要删除适合某个查询的对象)。
你怎么看?
而且,你有没有试验过这个方面?
对于此类任务,我对两个数据存储中的每一个的性能和可扩展性感兴趣。这是一种架构设计问题,欢迎提供应使其架构良好的特定商店选项或查询基石的详细信息,以展示经过深思熟虑的建议。
谢谢!
最佳答案
首先,这里有一个重要的区别:MongoDB 是一个通用数据库,Elasticsearch 是一个由 Lucene 支持的分布式文本搜索引擎。人们一直在谈论使用 Elasticsearch 作为通用数据库,但知道这不是它的原始设计。我认为通用 NoSQL 数据库和搜索引擎正在走向整合,但就目前而言,两者来自两个截然不同的阵营。
我们在我的公司同时使用 MongoDB 和 Elasticsearch。我们将数据存储在 MongoDB 中,并专门使用 Elasticsearch 来实现其全文搜索功能。我们只将需要查询的 mongo 数据字段的子集发送到弹性。我们的用例与您的不同之处在于我们的 Mongo 数据一直在变化:记录或记录字段的子集可以每天更新多次,这可能需要将该记录重新索引到弹性。仅出于这个原因,使用弹性作为唯一的数据存储对我们来说不是一个好的选择,因为我们无法更新选择字段;我们需要重新索引整个文档。这不是弹性限制,这就是 Lucene 的工作方式,它是弹性背后的底层搜索引擎。在您的情况下,记录一旦存储就不会更改这一事实使您不必做出选择。话虽如此,如果数据安全是一个问题,我会三思而后行,将 Elasticsearch 作为数据的唯一存储机制。它可能会在某个时候到达那里,但我不确定它还在那里。
在速度方面,Elastic/Lucene 不仅与 Mongo 的查询速度相当,在您的情况下,“在任何时候用于过滤的字段几乎没有什么常数”,它可能是幅度更快,尤其是当数据集变得更大时。不同之处在于底层查询实现:
关于mongodb - Elasticsearch vs.用于过滤应用程序的 MongoDB,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12723239/