基于Flink+ClickHouse打造轻量级点击流实时数仓 大数据

基于Flink+ClickHouse打造轻量级点击流实时数仓

前言 今天事情又比较多,写得言简意赅一些,看官勿怪。 Flink和ClickHouse分别是实时计算和(近实时)OLAP领域的翘楚,也是近些年非常火爆的开源框架,很多大厂都在将两者结合使用来构建各种用途的实时平台,效果很好。关于两者的优点就不再赘述,本文来简单介绍笔者团队在点击流实时数仓方面的一点实践经验。 点击流及其维度建模 所谓点击流(click stream),就是指用户访问网站...
阅读全文
一文看懂大数据生态圈完整知识体系 大数据

一文看懂大数据生态圈完整知识体系

随着大数据行业的发展,大数据生态圈中相关的技术也在一直迭代进步,作者有幸亲身经历了国内大数据行业从零到一的发展历程,通过本文希望能够帮助大家快速构建大数据生态圈完整知识体系。 目前大数据生态圈中的核心技术总结下来如图1所示,分为以下9类,下面分别介绍。 图1 1. 数据采集技术框架 数据采集也被称为数据同步。 随着互联网、移动互联网、物联网等技术的兴起,产生了海量数据...
阅读全文
Loading...