转载

【腾讯开源】专访RapidJSON团队:一个解析及生成JSON的C++库

RapidJSON是一个解析及生成JSON的C++库,可用于前台、后台程序,甚至是离线处理JSON的程序。 RapidJSON是目前性能最高、内存消耗最低的同类开源库,适合需要处理大量或巨大JSON文件的情况。

RapidJSON代码托管地址 : https://code.csdn.net/Tencent/rapidjson

CSDN:RapidJSON项目是如何诞生的?

RapidJSON:开始时只是想做一个简单的JSON库,可供日后的游戏引擎相关项目来做数据序列化用途。最早的思路是借鉴RapidXML的两个特点:只需头文件、原位解析(in situ parsing),但在整体架构上有很大差异。

CSDN: 相比目前同类的开源/商业产品,RapidJSON的特点是什么?

RapidJSON:高性能、合符标准、功能完善、跨平台。 RapidJSON除了支持一般同类库都会使用的DOM API,还支持SAX API,适合实现最高性能的JSON解析/生成。在程序架构上,RapidJSON使用C++模板的特性,在编译期让用户选择各种配置,当中甚至可以配置字符编码转码功能,例如解析UTF-8的JSON数据流至UTF-16的DOM。所有各种功能,若不使用,不会做成额外开销。

CSDN: 请介绍一下RapidJSON项目的开发团队的情况。

RapidJSON:除了本人和我的一个同事,还有几位国外社区开发者参与功能研发及周边支持。

CSDN: RapidJSON项目开发过程中遇到的最大困难是什么,你们是如何解决的?

RapidJSON:可能读者难以相信,我曾经遇到最困难的问题是如何快速并正确地做浮点数与字符串之间的转换。最初我只是用上简单的解析器及sprintf()做这两个事情,但简单的解析器会做成精度损失,而sprintf()就有性能问题。后来深入研究这两个问题的相关学术研究及各种实现,最后为前者实现了三种并用的算法(FastPath、DIY-FP、BigComp),而为后者实现了Grisu2算法(Google V8中也采用了Grisu3) 。通过这些努力,RapidJSON在浮点数的正确性和性能都能完胜其他库。

CSDN: RapidJSON在腾讯内部的使用情况如何?

RapidJSON:在IEG(互动娱乐事业群),RapidJSON应用于一些组件的序列化,也用于提升一些第三方库的读文件性能,例如我们使用RapidJSON替代二维骨骼动画软件Spine的JSON库,大幅提升读取动画资源的速度。此外,在SNG(社交网络事业群)和OMG(即时通讯事业群)里也在项目在后台里应用了RapidJSON替代原来的库,达到以倍数计的性能提升。

CSDN:RapidJSON今后的目标和 开发计划是什么?

RapidJSON:目前我们正在实现JSON Pointer,以及JSON Schema校验器。 JSON Pointer可以简化一些DOM的查询工作,以及可以在JSON内实现引用或其他数据驱动。而JSON Schema校验器,类似XML Schema,可以校验一个JSON是否符合自定义的格式。现时开发中的JSON Schema仅使用到底层的SAX事件进行流式校验,可以不读入整个JSON文件进行校验,可用于校验极巨型的JSON文件,这种校验方式应该是一个创新的做法。除了这两个新功能,也会实现一些用户issue的需求,以及进一步的优化。

CSDN: 出于什么样的考虑决定将其开源?对于该项目开源之后的发展有和期望?

RapidJSON:RapidJSON最初是以个人名义,在业余时间开发。最近通过公司内部流程以公司名义开源,可以让我和同事把它放进工作日程中,而且公司的各个部门可参与维护及社区的运营,我觉得是一个很好的转型。

我认为RapidJSON已完善地解决了一个需求确切的问题,我相信它已经是一个很有竞争力的项目(详见 https://github.com/miloyip/nativejson-benchmark )。接下来除了增加功能及优化,最重要的是想怎样把它应用到各种场景中。例如现时已有社区开发者建了一个Lua binding的项目,希望之后还会有Python、Ruby、Node.js等语言的bindings出现,也希望可以整合至其他的C++项目,例如我们可能会把整合提交至Spine,甚至是其他有JSON需求的项目中。当然,培训、宣传及社区运营也是很重要的环节。 RapidJSON是我做的第一个开源项目,以后我们还希望把其他一些游戏相关的项目开源,回馈社区。

正文到此结束
Loading...