转载

你在以错误的原因看待NoSQL数据库吗?

你在以错误的原因看待NoSQL数据库吗?

  英文原文:Are You Looking at NoSQL Databases for the Wrong Reason?

  我最近看到一篇报道,在某些条件下,PostgreSQL 在很多重要地方胜过 MongoDB,这让我想起了关于数据存储选择方面的、不同选项背后的理论,特别是在 SQL 和 NoSQL 解决方案之间的天真比较——不幸的是,这一幕经常发生。

  上面的评测由 EnterpriseDB 创建,EnterpriseDB 是开发 PostgreSQL 的商业公司(因此测评可能会有一点儿偏见……),除了这个明显的事实,我已经注意到 PostgreSQL 是让人惊奇的产品,在这一点上,我推荐它作为亟待解决的、大部分数据存储问题的、最佳方案之一。有着非凡性能需求的知名企业都正在 PostgreSQL 上投入巨大。

  然而,我这里的观点稍微不同:我自问,大多数公司是否正确地看待着“NoSQL”解决方案、以及性能需求是否已经成为他们急需考虑的。比如,让我们看看 MongoDB 词条在维基百科上的解释,它是我这些天经常在用的、一种数据库:

MongoDB 是一种跨平台的面向文档的数据库。作为一种 NoSQL 数据库,MongoDB 没有采用传统的基于表的关系型数据库结构,而是钟情于带有动态模式的类 JSON 文档(MongoDB 称之为 BSON),使得特定类型的应用程序里的数据集成更容易、更快速。

  我想刻意强调句子中的“特定类型的应用程序里”,因为这恰恰就是我要说的:你不能仅仅因为性能就抛弃关系型数据库、转而采用面向文档的数据库,因为这是愚蠢的动机:一个调优的 SQL 数据库每秒处理的事务能够超过 14000 条,因此如果你超过了这个量级,说明你已经在一流的公司里了,有着首要的扩展需求:恭喜!

  相反,

当实体大部分与树形结构相关,且关系模型持续被迫地创建 join 或重度反规范化关系而超越了其合理性时,文档数据库就是优于关系型数据库的更好的解决方案。

  在这种情况下,数据模型符合上面的约束,那么面向文档结构有能力比关系型模型创建更少的、与面向对象设计不匹配的现象。据我们所知,所有重要的关系型数据库模式创建了大量的与对象模型相关的属性,这就是饱受诟病的对象关系阻抗不匹配(Object-relational impedance mismatch)问题。面向对象的系统通常是树状结构,它比其它模型能够更好地适应文档数据库,图数据库【注1】除外,很明显,图数据库实现了一个图的大部分通常表现。

  在 SQL 领域之外,我总是建议不要低估你和团队正在失去大部分久经考验的工具和专长,你们每天都在不自觉地应用着。我看到过很多人费力地从 NoSQL 仓库抽出非常基本的信息,而这些信息用关系型数据库就可以容易地实现,主要是因为多年来人们都是这样做的。那么,NoSQL 数据库在管理事务上,和“正统的”关系型数据库相比,有着很大的不同:用最终一致性(Eventual Consistency)和幂等服务(Idempotent Services) 设计应用程序,你知道意味着什么吗?

  我不是说你不应该采用新技术,因为我和公司已经为此做了很多,但是我的最终建议是:

采用适合你的领域模型(domain model)【注2】的数据存储方案,不要过早地性能伪优化:你可能在尽量解决错误的问题。

  • 注1:图数据库也可称为面向/基于图的数据库,对应的英文是 Graph database。图数据库的基本含义是以“图”这种数据结构存储和查询数据,不是存储图片的数据库。图数据库的基本存储单元为:节点、关系、属性。http://zh.wikipedia.org/wiki/%E5%9B%BE%E6%95%B0%E6%8D%AE%E5%BA%93
  • 注2:领域模型可以被看作是一个系统的概念模型,用于以可视化的形式描述系统中的各个实体及其之间的关系。领域模型记录了一个系统中的关键概念和词汇表,显示出了系统中的主要实体之间的关系,并确定了它们的重要的方法和属性。因此,对应于用例所描述的动态视图,领域模型提供了一种对整个系统的结构化的视图。领域模型的一个好处是描述并限制了系统边界。http://zh.wikipedia.org/wiki/%E9%A2%86%E5%9F%9F%E6%A8%A1%E5%9E%8B

  — END —

  译文: 《你在以错误的原因看待 NoSQL 数据库吗? 》 腊八粥

正文到此结束
Loading...