转载

发表于 2015年10月30日
浏览 (533)
评论 (0)

LinkedIn开源PalDB，一个只读的键值存储数据库

LinkedIn开源了PalDB，一个可嵌入的键值对存储数据库，比LevelDB快8倍，并且内存占用比hashset少数个量级。

PalDB 是一个由LinkedIn开源并使用Java编写的一次写入键值存储数据库。当存储创建后所有的操作都是禁止的，它是只读的。这样做的目的是提升读操作的性能并降低内存占用。LinkedIn的建议是使用它来存储 side data ，他们对于side data的定义是“一个过程以完成其工作而需要的额外的只读数据。例如，被自然语言处理算法所使用的一系列已经停止使用的词汇就是side data”。

PalDB是可嵌入的，它不使用模式并将数据保存在二进制文件之中。它提供了随机数据访问的 API 。

据LinkedIn所说，它优化了读操作，性能可与类似于HashMap和HashSet这样的常驻内存的数据结构一较高下，同时需要的内存显著减少，这些特性是公司在设计它时苦苦追求的。例如，一个含有100M键的hashset需要超过500MB的内存而PalDB只需要大约80MB。或者，35M个用户ID使用hashset存储需要1.8GB的内存而PalDB只需要290MB。在PalDB中使用 Snappy 来压缩数据的话将会使用更少的内存。

在速度方面，LinkedIn的性能测试显示PalDB拥有2M读/秒的性能，或者说比HashSet快6倍，比LevelDB或RocksDB快8倍，这个测试环境是MacBook Pro 3.1 GHz和一个10M-键索引。

PalDB优化了存储访问。将数据存储在磁盘上将会导致相当差的表现。尽管没有限制数据的大小，索引的大小限制为2GB。此外，重要的是要知道PalDB不是线程安全的。

查看英文原文： LinkedIn Open Sources PalDB, a Read-only Key-value Store

感谢张龙对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作，请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博（@InfoQ，@丁晓昀），微信（微信号： InfoQChina ）关注我们，并与我们的编辑和其他读者朋友交流（欢迎加入InfoQ读者交流群 LinkedIn开源PalDB，一个只读的键值存储数据库）。

正文到此结束

所属分类：编程技术

本文标签： 数据库 App API db IDE http 测试数据 src 翻译 UI 微博 java map 开源安全 value 线程 key
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(12,914) 评论(0)
Caffe 深度学习框架上手教程

浏览(9,970) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(10,824) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(10,704) 评论(0)
Decorators in ES7

浏览(15,196) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(28,137) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(11,631) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(10,676) 评论(0)
Seaweedfs之Volume读请求重定向

浏览(24,940) 评论(3)
HTML、CSS及JavaScript ：有Promise，不会搞大肚子

浏览(12,805) 评论(0)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG