转载

开源有效,不信请看 Facebook

Facebook 这家公司喜欢分享他们的成果。在过去的一段时间里,这家公司开放了很多 内部项目 的代码和设计。公众可以免费的使用和修改这些代码,甚至可以在其基础之上构建新的系统。

对于很多公司来说,开源并不是一件新鲜事。但是 Facebook 在这方面做得尤为出色,因为他们开源的东西,真正的被很多人使用了。有一家叫做 Datastax 的新公司,就是靠着为 Facebook 的开源数据库Cassandra 用户做技术支持来赚钱的。就连 苹果公司 的数据中心,也在借鉴脸书的Ambitious服务器设计方案。

当然,这并不为奇,Facebook 最新的开源项目之一---presto,也已经赢得了许多外部公司的支持。Facebook近来发布了一个新的大数据工具版本,并发表言论称,该版本比以前的版本快两倍。但即使该产品没有新的改进,在几家别的有影响力的企业,其中包括:Airbnb,Dropbox,和Netflix.presto只找到了一家。

新的像Hadoop的大数据工具让公司比较廉价而高效地存储和分析海量数据。但是他们最终要求严格编程来分开使用。presto,简而言之,就是让数据分析使用他们在新时代系统中来查询数据存储的SQL技巧,诸如Hadoop和cassandra.另外,它比用于查询Hadoop的标准工具快多啦。

它在很多方面都类似于其它的开源工具,诸如 Cloudera’s Impala 和  MapR’s Drill , 它们同样都是在追求加速和简化Hadoop查询. 但Facebook和许多像Cloudera 和 MapR 这样的公司之间的不同在于,Facebook制造 为己所用的 工具,而不它想象中别的公司会怎么用的工具. 而那就意味着Facebook开发的软件在提供给其它网站用之前,已经在这个世界上最大的网站之一上进行了实战测试.

“我们将Presto添加到我们的数据基础设施工具中,因为它拥有一个在真实环境中进行产品级使用的跟踪记录,”  Dropbox 软件工程师 Fred Wulff 如是说, 他指出该公司已经对几项不同的指标进行了评估.

对于 Argyle Data 而言,它为无线运行商提供了一项欺诈检测服务,这个工具正好能应对公司的需要, 市场主管 Ian Howells 如是说. 而且,价格也不错. “回想几年前,” Howells 说道. “如果你不得不去买一个运行在成千台服务器上的分布式SQL引擎, 你将需要向Teradata 或者 Oracle送多少钱? Facebook 让这都变成了免费的.”

当然,不像 Drill 或者 Impala, 它们都会由主要目标是开发和支持这些工具的公司进行备份, 想在还没有商业公司为Presto进行支持, 我们已经看到像 Datastax 和 Continuuity 这样的公司开始对最初由Facebook开发技术进行商业化的使用. 下次如果看到有一个Presto公司不要惊讶哦.

正文到此结束
Loading...