羽毛也疯狂,盘点 Apache 最新毕业的11个顶级项目 编程技术

羽毛也疯狂,盘点 Apache 最新毕业的11个顶级项目

自1999年成立至今,Apache 软件基金会已成功建立起自己强大的生态圈。其社区涌现了非常多优秀的开源项目,同时有越来越多国内外项目走向这个国际开源社区进行孵化。据悉,目前所有的 Apache 项目都需要经过孵化器孵化,满足一系列质量要求之后才可毕业。从孵化器里毕业的项目,要么独立成为顶级项目,要么成为其他顶级项目的子项目。 为便于大家了解 Apache 孵化的标准,本文盘点了 Apache...
阅读全文
分布式列式数据库 IndexR 开源啦! 开源软件

分布式列式数据库 IndexR 开源啦!

2017新年好!IndexR开源啦! IndexR是一个专注于大数据实时分析的分布式列式数据库,它基于HDFS,能快速分析海量结构化数据,支持实时导入并且查询秒级延迟,特别适合ad-hoc场景下的OLAP查询。 IndexR具体实现参考并使用了众多优秀的开源项目,比如 Infobright,Hbase,Druid,Drill 等,与Hadoop生态圈深度结合。目前它主要通过作为Apac...
阅读全文
Julien Le Dem对使用Apache Arrow进行面向列的数据处理的未来的看法 编程技术

Julien Le Dem对使用Apache Arrow进行面向列的数据处理的未来的看法

Julien Le Dem是 Apache Parquet 的合著者,也是 Apache Arrow 项目的项目管理委员会成员,他在 Data Eng Conf NY 上介绍了面向列的数据处理的未来。 Apache Arrow是在内存中执行列式计算的开源标准,源于Apache Drill的内存列式数据结构。Apache Arrow旨在成为有效地在内存中保存数据并在不同执...
阅读全文
你应该知道的大数据领域12大动向 编程技术

你应该知道的大数据领域12大动向

最近这几周大数据领域可谓动作频频,初创公司和老牌企业都纷纷发布新品,更新或改进现有的产品系列,以及达成战略性关系。 行业观察人士表示,许多企业拿来试点阶段的大数据系统(尤其是那些整合Hadoop平台的系统)后,将它们部署到更广泛的生产环境。本文介绍的新闻主要旨在帮助公司进行这种转型。 下面看一下引起我们关注的12则与大数据有关的动向。其中许多来自近日在加州圣何塞召开的2016年Hadoop...
阅读全文
数人云 | 一场属于 Docker&Mesos 的夏日欢乐颂 编程技术

数人云 | 一场属于 Docker&Mesos 的夏日欢乐颂

上次畅谈容器技术的诗和远方还是 4 月份的春天, 如今,夏天已悄然而至。 在西雅图刚结束的 “DockerCon 2016” 大会上, Swarm 原生编排备受推崇, 有人不禁担心 Mesos 将何去何从? 7月份, 让我们来一场属于 Docker&Mesos 的欢乐颂, 愉快地探讨一下这个“严肃”的话题:) 号外,论如何优雅的将开源技术进行到底, 中国开源云联盟成立了 WG11...
阅读全文
大数据即服务(BDaaS):大数据行业的下一个热门丨数据工匠简报(6.20) 编程技术

大数据即服务(BDaaS):大数据行业的下一个热门丨数据工匠简报(6.20)

大数据即服务(BDaaS):大数据行业的下一个热门 大数据指的是那些我们正在创造与存储的、日益增长的信息,还有对这些数据的分析与使用。按照商业意识的概念,大数据特别指代从分析中收集洞见,然后将这些见解应用在实际中以推动业务成长的做法。 在这个时候,BDaaS是一个有些模糊的术语,经常用于描述种种将大数据功能外包到云端的做法,范围从提供数据,到提供用于查询数据的分析工具(经常借助web面板...
阅读全文
共筑Spark大数据引擎的七大工具 编程技术

共筑Spark大数据引擎的七大工具

共筑Spark大数据引擎的七大工具 Apache Spark不仅仅让大数据处理起来更快,还让大数据处理起来更简单、功能更强大、更方便。Spark并非只是一项技术,它结合了诸多部分,新的功能和性能改进不断添加进来,每个部分都在不断完善之中。 作者:布加迪编译 来源:51CTO.com | 2016-03-21 09:56 ...
阅读全文
Hadoop生态系统在壮大:十大炫酷大数据项目 编程技术

Hadoop生态系统在壮大:十大炫酷大数据项目

【51CTO.com快译】在开发人员开发Hadoop以克服大数据带来的挑战之后的10年间,这些技术的生态系统在不断发展壮大。Apache软件基金会下面有众多的开源大数据技术项目。本文介绍一些重要项目,并顺便了解几个新兴项目。 管理和分析大数据已经变成了重大挑战,数量急剧增加的信息从社交媒体、连接到物联网中“物件”的传感器、结构化数据、非结构化数据以及可以收集的其他一切数据收集而来。为...
阅读全文
Drill官网文档翻译四 Drill的性能 编程技术

Drill官网文档翻译四 Drill的性能

(翻译自apache drill 官网。) Drill是从地基开始就奔向高性能和大数据集去设计的,下面列出来的是Drill能够做到高性能的核心要点。 分布式的引擎 Drill提供了一个强大的分布式引擎来处理查询。用户可以从集群的任何一个节点是提交查询。你可以添加新的节点到集群中,以为了支持更多用户的更多数据,或是获得更好的性能。 列式执行 通过使用一种纯内存的分层的,列式的数据...
阅读全文
Apache Kylin在百度地图的实践 编程技术

Apache Kylin在百度地图的实践

1. 前言 百度地图开放平台业务部数据智能组主要负责百度地图内部相关业务的大数据计算分析,处理日常百亿级规模数据,为不同业务提供单条SQL毫秒级响应的OLAP多维分析查询服务。 对于Apache Kylin在实际生产环境中的应用,在国内,百度地图数据智能组是最早的一批实践者之一。Apache Kylin在2014年11月开源,当时,我们团队正需要搭建一套完整的大数据OLAP分析计算平台...
阅读全文
Loading...