转载

邓德源:谷歌内部的容器集群管理实践

由CSDN重磅打造的2016中国云计算技术大会(CCTC 2016)将于5月13日-15日在北京举办,大会特设“中国Spark技术峰会”、“Container技术峰会”、“OpenStack技术峰会”、“大数据核心技术与应用实战峰会”等四大技术主题峰会,以及“云计算核心技术架构”、“云计算平台构建与实践”等专场技术论坛。80+位一线互联网公司的技术专家将到场分享他们在云计算、大数据领域的技术实践,目前大会剩票不多,欲购从速。详情请点击CCTC 2016大会官网

作为中国云计算技术大会的四大技术峰会之一的Container技术峰会,从一开始就受到了非常多的关注,随着议题的不断揭露,我们从多个角度了解到今年Container峰会的不同,无论是讲师阵容,还是演讲议题的质量都堪称顶级,得到了容器圈大咖们得肯定,今天,给大家带来的采访来自本届Container技术峰会的邓德源讲师,他目前任职才云科技CTO,曾是Google容器集群管理核心成员。

邓德源:谷歌内部的容器集群管理实践

CSDN:目前对Docker领域的关注重点是什么?

邓德源:这两年Docker大火,但我们的观点是:Docker只是“开始”,远不是“终点”或万灵药。当很多企业尝试用Docker后,会立刻浮现很多实际问题:docker多了怎么管理,跨主机Docker之间如何通信,在Docker的世界里新的运维流程和体系该如何构建。总而言之,Docker这项新技术,不光意味着新的学习曲线,还可能会改变用户或企业多年所积累下来的开发、运维实践习惯和体系,这才是最大的挑战和鸿沟。

CSDN:能介绍下谷歌在容器集群管理方面的经验吗?

邓德源:谷歌十多年来在容器集群管理方面的经验都体现在谷歌推出的三个容器集群管理系统上:Borg, Omega和Kubernetes。前二者是谷歌对内使用,Kubernetes则是开源项目,基于Borg的理念用Go重新改写的框架。Kubernetes尽管和Borg有相当的差别,大家还是可以管窥一豹,通过它来了解谷歌内部的容器集群设计理念。

CSDN:之前在谷歌的从业经历,对您个人以及公司来说有哪些影响?

邓德源:我曾在美国谷歌(Google)集群管理组工作(Cluster Management Team),和我们才云CEO张鑫是大组的同事。我当时主要参与开发集群管理系统。该系统为谷歌所有运维工程师提供统一的集群管理入口,是谷歌自动化运维的重要组成部分。这个系统保证了系统升级、软硬件错误等均能及时被发现并处理,保证谷歌集群能24/7小时不间断工作。

在谷歌期间还参加了开发基于容器集群的开源项目Kubernetes,这个项目将谷歌多年内部使用容器的经验以开源的形式呈现给所有开发者。

我和CEO张鑫曾经在美国谷歌底层容器集群团队管理开发的第一线积累多年经验,让我们对才云自己的产品和性能定位有非常高的要求。我们在意的是最终Caicloud云平台产品能为国内的客户提供谷歌式、谷歌级的分布式集群管理系统,管理亿万容器。

CSDN:企业在应用Container/Docker技术时,需要做哪些改变吗?企业如果想快速应用Docker应该如何去做 ?

邓德源:对于一个企业,在生产环境上使用容器而言,docker/container本身是不够的,就像我前面提到的,当你把应用和进程都用容器包起来(这一步是简单的)之后,这些无状态的应用/容器之间如何去互联、调度、运维,这些问题容器本身是无法解决的。所以,在企业生产环境的层面上考虑使用容器,一定需要考虑“容器集群”管理的问题。容器集群管理框架的选择,有很多种,这些框架本身在集群功能、实现原理和复杂度上都有很大差异。至于如何选择,首先要对这些框架有基本了解,同时还要结合企业自身的具体需求。

CSDN:你所在的企业在应用Container/Docker或者k8s技术时遇到了哪些问题?是如何解决的?

邓德源:我们Caicloud平台在为我们客户企业服务和落地过程中,基于K8S的框架下很多细节有很多改变和二次开发,这在开源项目来说是不可避免的。

细节的情况可以来参加我们在多个城市定期举行的Kubernetes meetup活动,我们在 meetup讲座中都有很仔细的梳理这些我们在为客户开发过程中遇到的Kubernetes的坑以及我们所提供的解决方案。我们接下来5月21日在上海会有Kubernetes meetup,欢迎大家前来参加、交流。

CSDN:作为当前最流行的Container技术,您认为Docker还有哪些方面需要改进?

邓德源:Docker作为一个备受瞩目的新技术,也存在诸多方面需要改进。例如如何能更平滑的使传统企业应用过渡到Docker中,如何应对有状态应用,如何在大规模生产系统中进行运维和管理,这些都需要在Docker外,通过更广多的生态圈来予以解决。

CSDN:您在本次演讲中将分享哪些话题?

邓德源:我在这次大会的分享题目是:《谷歌容器集群管理系统实践》,会从我在谷歌底层集群团队所做的集群管理系统为切入口,来介绍谷歌内部的集群管理系统,从具体流程上给大家介绍谷歌的经验,如何来保证管理运维工程师提交的生产环境变更请求,自动化风险分析,自动化生产环境准备工作,及各种集群容错处理。谷歌内部的容器集群管理范畴要远大于Borg,来保证谷歌系统升级、软硬件错误等均能及时被发现并处理,保证谷歌集群能24/7小时不间断工作。

CSDN:哪些听众应该了解这些话题?您所分享的主题可以帮助听众解决哪些问题?

邓德源:有上容器、容器集群、微服务需求的企业;在分布式系统使用上对以下功能有需求的企业:包括调度、编排、服务发现,配置管理、灰度发布、健康检查、弹性扩容、环境一致等功能;同时,企业对自身系统的高可用性、稳定性、高性能以及易用性有需求。这些企业都很适合来了解谷歌内部集群系统的讨论,不仅可以对谷歌十多年来内部使用容器集群的整体设计架构有所了解,同时也可以把这些设计原理应用到自身企业。

原文  http://geek.csdn.net/news/detail/72890
正文到此结束
Loading...