转载

为什么Google将数十亿行代码储存在单一的源码库

  过去 16 年,Google 使用一个中心化源码控制系统去管理一个日益庞大的单一共享源码库。它的代码库包含了约 10 亿个文件(有重复文件和分支)和 3500 万行注解,86TB 数据,900 万唯一源文件中含有大约 20 亿行代码。

  2014 年,Google 的 2.5 万名程序员每周修改 25 万个文件中的 1500 万行代码。相比之下,Linux 内核源码库有 4 万文件和 1500 万行代码。

  Google 的程序员每个工作日递交 1.6 万次 commits,还有 2.4 万 commits 是自动系统完成的。代码库每天响应了数十亿次文件读取请求,高峰时每秒需要执行 80 万次查询,工作日平均每秒需要执行 50 万次查询。

  在 2012 年 10 月前,这个库只支持 Linux,之后加入了 Windows 和 Mac 支持。2012 年前人类递交的 commits 占多数,但之后 Google 切换到了定制的源码控制实现,自动的 commits 开始增加。《ACM 通讯》刊登了一篇文章描述了 Google 为什么将数十亿行代码储存在单一的源码库。

正文到此结束
Loading...