转载

专访云智慧 CEO 殷晋:APM 已经爬到顶峰 未来又将如何?

如果说 2015 年科技行业的关键词是「O2O」的话,2016 年的关键词绝对应该是「企业应用和企业服务」,但是这个风口并不是无缘无故而来的,在过去的几年中,这些以发展技术能力为主的公司一直都在默默无闻地快速成长,同时他们也用优秀程序员必备的冷静、精明而又有缜密逻辑的头脑时刻关注这个行业正在发生的变化并不断地推动技术的革新与进步,这些都为这个风口的爆发奠定了坚实的技术能力。同时移动互联网的强劲增长成为这个风口爆发的催化剂,因为移动互联网彻底改变了这个行业的玩儿法,思维的改变带来现实的改变,而现实的改变离不开基础技术的变革。

我们可以看到,传统 IT 时代的巨头 IOE 正在瓦解和改变,以 AWS、Microsoft Azure、阿里云为代表的新的 IT 生产力成为去 IOE 的主力军。维持互联网和移动互联网行业的基础技术正在悄然发生着改变,从「服务器」到「云」,从「机房」到「数据中心」,这些在外人看起来只是表面上的文字的变化,实际上是最本质的改变。

已经敏锐感受到这种变化的公司现在已经享受到了革命的成果,而掌握着基础核心技术的、也是最早嗅到这种变革的企业应用和企业服务公司也已经走过了艰难的爬坡阶段,正在走上巅峰。也正是在这种「变革」的时刻,TECH2IPO/创见记者采访了云智慧的 CEO 殷晋。

一、意外

云智慧是一家以企业应用性能管理 (Application Performance Management,以下简称为 APM) 为核心业务的企业应用和企业服务公司,我在比较早的时期就开始关注这家公司,这也是我第三次采访 Andy,每次采访的时间也正好是云智慧发展到一个关键节点的时刻。这三年来,云智慧也按照自己的思路有条不紊地开拓自己的业务,发布新的新产品。到了今年,监控宝、透视宝和压测宝这三个作为 APM 业务的关键产品已经形成了云智慧企业应用性能管理整体解决方案的矩阵优势,正式对外发布。在回顾这些年的时候,Andy 说云智慧「三宝」先后推出的顺序也是和市场的需求有关系的,也符合 APM 工作的规律,而现在的云智慧已经走过了当年的爬坡阶段,已经到达了顶峰这样一个状态。

云智慧的第一个产品「监控宝」是在 2010 年左右推出的。2010 年时候的网络语境很多人还是有印象的,比如在很多下载站、很多游戏要先问你是哪个移动运营商,在北方还是南方,在哪个省哪个市,看起来都是互联网,但因为网络接入服务的碎片化形态导致互联网并不能畅快的互联互通。另外,很多网站的服务器都放在不同地点和不同运营商的机房中,DNS 服务也不稳定,经常造成网络的瘫痪。这个时候个人网站站长或者一些网站的运维非常痛苦,他并不知道全部用户是否能够顺利访问到自己的网站,也许某个城市的用户可以,而另外一个城市的就无法访问,或者联通的用户访问速度很快,而电信的用户则连不上。

所以当时的运维人员几乎都是崩溃的,他完全没有办法预测到什么时候或者是哪条线路会出问题,只能在问题出现后当「接盘侠」,一旦网站出现损失,而且还有可能变成「背锅侠」,当时运维同学经常会使用一些站长工具来 Ping 自己网络状况是不是好,有些有钱有实力的大公司则会在各个地方派出员工去实时测试网络情况,这种方法非常原始,而且效率也不高。「监控宝」就是在这个语境下产生的。最初形态的「监控宝」最初把这个功能做成了自动化工作,把 Ping 这种需要频繁使用的一次性工具变成了自动化和周期化的监控产品,把运维人员从重复劳动中解救了出来。

此时的「监控宝」获得了最初的第一批用户,而且当时这种效率很高的工具都会在运维圈子里相互推荐,再加上微博等社交网络的兴起,监控宝的用户数也在快速增加。Andy 说,「监控宝」后面的功能就是按用户的真实需求来驱动产品的发展,从最初的网站监控扩展到服务器监控、服务监控以及自定义监控,几乎涵盖了运维工作最基本的需求,产品本身也出现了一段时间的停滞。

发展到已经阶段以后,监控宝正式开始了商业化,但却发现一个问题,目前监控宝的产品设计并不适合企业用户,当企业的运维人员超过 3 个人的时候,运维就有了「协作」的概念,而现有的产品模型无法支持企业级的权限监控和协作,而上面说产品出现的停滞的那段时间就是在重构底层的账户模型。然而企业运维产生更大规模的时候,监控宝也陆续增加了很多功能,内容监控,API 监控,网页性能监控,安全监控等等。

二、进化

在监控宝一炮打响之后,市场的需求又有了一定的变化。监控宝的定位在于一种简单的场景,解决最基本的全栈 IT 基础设施监控的问题,对于很多 IT 成熟度很高的公司来说,这种工具的价值并不明显,因为监控宝解决的问题在他们的成熟度下已经被解决的比较好了。对于 IT 成熟度很高的客户,IBM、HP、CA、Oracle、Compuware、Riverbed、Netscout 等公司已经给他们建立了非常完善的监控系统,云智慧再去切入并没有太大的市场,然而此时,移动互联网和云计算带来了新的冲击。

Andy 认为,移动互联网和云计算两个概念在分开的时候没有太大的感觉,而如何两者结合起来则可以产生颠覆性的作用,因为移动互联网+云计算带来了一个新的命题,叫做用户体验前置。什么是用户体验前置呢?我们看看传统的银行系统,如果你不去柜台,或者登陆他们的网银,你是不会接触到他们庞杂的 IT 系统的。但有了移动互联网,一切都不一样了,通过手中的 App/微信公众号等,开始无缝的和他们的 IT 应用系统打交道,IT 应用再也不是看不见摸不着的东西了。这块是一个战略的空白区间,云计算的发展更是给企业传统 IT 应用架构带来了巨大的变化。用户体验前置,IT 应用架构变化,但是市场上没有一个很好的工具能够帮助用户解决他们在这两块的监控难题。

举个例子,曾经有一段时间,各个银行的 App 产品非常难用,用户叫苦不断,从而导致支付宝等第三方支付的崛起。而之所以银行自己的 App 让人感觉非常难用,是因为它是基于银行现有的 IT 体系我基础开发的附属品,并不是根据移动互联网以及用户体验来设计的。用户之所以在以前没有察觉到是因为有柜台人员替你进行了操作,当 App 把银行的 IT 系统直接联系到用户的时候,问题就出来了。

问题有了,就意味着有了新的需求,也就有了新的方向。于是这个新产品从监控宝 2.0 中独立出来变成了「透视宝」。如果是「监控宝」解放的是运维人员,而「透视宝」则解放了运营人员。

「未来」对于很多人来说有些恐惧,而恐惧是来源于对未来的不可预知性和不确定性。对于一个互联网公司的产品运营、技术和 IT 工程师来说也一样,找到问题不难,而在于如何去解决这个问题。进一步,找到并且解决现成的问题也不难,更难的是从目前平和的状态中找到预知的命题并提前找到问题。

比如对于一个产品运营岗位的同学来说,可以通过对现有数据的分析找出产品出现了什么样的问题,但是这个问题归根结底出现在哪里,又该如何去解决这个问题是难的。同时,对于用户提出的需求反馈,经过产品和技术之间的沟通反馈到新版里又需要花费很长的时间,很可能竞争对手就在这段时间里率先解决了这个问题。在这个时候,如何比竞争对手,以及用户更早发现不可预知的产品问题就尤为重要了。

对于 IT 工程师来说,写代码的工作并不麻烦,麻烦在于 bug 出在哪里,bug 如何改,在此时,如何在 bug 还没有出现的时候就能预测到问题可能会出现也非常的重要。

如果你能够理解上面所描述的问题的时候,那么你就不难了解「透视宝」了。透视宝是新一代面向业务的端到端应用性能管理平台,不论是移动 App 还是 Web 应用,透视宝以真实用户体验的视角,为企业提供实时的性能监控、分析与管理解决方案。帮助运维工程师快速定位故障查找问题提速 90%,协助开发人员定位到代码级的深层问题,不断优化性能瓶颈和 IT 架构,业务上线周期缩短 60%。借助透视宝运营和业务人员可以实时掌握关键事务、用户体验与性能的关联问题,降低运营风险 30%,简而言之,透视宝在降低运营成本,提高业务增长方面具备核心支持作用。

三、成熟

Andy 认为,有了监控宝+透视宝,云智慧基本上建立起真正覆盖 IT 成熟度较高的企业级用户需求的产品力,真正有能力来服务企业级客户,而这些产品的发展就构成了云智慧在 2015 年从 SMB 市场向企业级客户市场迈进的动力。

到了企业级用户市场,云智慧又发现了新的用户需求痛点,就是性能测试问题。在 SMB 客户那里,产品上线之前不会做大规模的性能测试,很难产生性能测试需求。而答案还是在上面的那张 IT 成熟度模型图里面,因为 SMB 客户的 IT 成熟度较低,同时网站/应用的商业价值也比较低,所以他们不会、也没必要投入那么多资源来做这种事情。

而在 IT 成熟度高的企业级客户那里,压测是产品上线前的必备流程,甚至在很多 DevOps 实践比较好的企业里,压测不仅用于上线前的测试,而是和他们的 CI 系统集成,作为每次 Build 都要执行的常规监测手段,从而实现 Release Automation。

然而现在市面上的性能测试软件几乎在这种新的变化面前是无能为力的。用户体验前置要求性能测试基于真实的场景和真实的链路来进行,而和 CI 系统的集成也不是那些传统测试软件能够搞定的事情。

所以基于云智慧全球分布式部署的服务器网络、公有云资源、客户私有云资源构建的压力测试网络,根据真实用户在网站和 APP 上的使用场景进行测试,提供开放的 API 接口可以让 CI 系统驱动测试自动运行的「压测宝」就应运而生了。这也是上周云智慧发布的「第三宝」。

有了压测宝,云智慧的应用性能解决方案形成了一个闭环,能够帮助企业解决用户体验前置带来的挑战,以及云计算的快速发展带来的系统架构变化的挑战。

四、改变

当云智慧的「吉祥三宝」形成闭环后,形成一个全站式的性能管理解决方案之后,Andy 认为这解决了云计算快速发展和用户体验前置给企业 IT 带来的种种挑战,标志着云智慧已经具备了为中、大型企业用户提供完整应用性能管理服务的产品和技术能力。

Andy 在采访中特别强调,令人意外的是传统企业对性能管理有着极强的需求,而且接受度非常高,在这方面甚至超过了互联网公司。说在过去几个月中,他几乎都在南方的各个大型企业中了解客户需求,他有一个很明显的感受就是上文所提到的「用户体验前置」,大型企业的产品和用户开始直接建立起关系,而在建立这种关系的时候感受到了现有 IT 技术无法满足这种新的趋势和需求,也明显感受到了这些传统大型企业转型的焦虑感和迫切的需求。当他们发现像云智慧这样新的工具可以帮助他们解决问题的时候,会非常乐于接受而且不计成本。

他解释说,如今,互联网+已经成为中国经济发展新常态下促进产业转型升级,培育经济增长的新动力,为企业发展不断注入新的活力。而移动互联网的广泛应用和云计算的高速发展,为企业传统 IT 架构带来了巨大的挑战:用户体验前置、IT 基础设施广泛云化、产品迭代越来越快,开发、测试和运维工作逐渐融合,被 DevOps 所取代。

诚然,DevOps 现在已经变成了一种强需求。 DevOps (Development 和 Operations) 用行话来说是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障/QA 部门之间的沟通、协作与整合。说简单,DevOps 的核心就是「多个部门之间的协作」,如果要更好的完成一个项目,开发和运营工作必须紧密合作,从而增加真个企业 IT 服务能力和敏捷性。

基于 IT 工作本身的属性,DevOps 非常适合传统企业 IT 部门的转型。这些企业大多都诞生在云大规模应用之前,主要基础设施仍然是还是以物理设备为主,随着移动互联网和云计算的不断深入,这些企业在转型有着传统的优势,比如可以打造出比较强的应付体系和能力,能够支撑大型应用的发布和更新,但是这些企业内部经常会出现 IT 资源管理者和 IT 资源使用方发生冲突的情况,说的清楚一些就是懂产品的不懂技术随便大开脑洞,而懂技术的不懂产品指责产品经常提出一些不切实际的需求 。

现在云智慧的全栈性能管理解决方案则基本上可以有效洞察企业实际业务流程,把基于真实用户访问体验的应用性能数据与业务端的经营数据进行关联,并以可视化的方式呈现,在推动 DevOps 有效落地的同时,不断提升企业的 IT 运维能力、业务运维能力、业务运营能力、组织服务能力和商业决策能力,进而实现企业互联网+成功转型。

五、解放

在上一次采访 Andy 的时候,有一句话让我感受很深,「哪个程序猿不想面朝大海,春暖花开,写写代码,自由自在?」这句话他和我说了三次。

在之前参加一次媒体沙龙的时候,殷总也正好在场,他讲了一个故事,他曾经还没有创业的时候,所在的公司用百万美元收购了一个英国的小公司,与其说是个小公司不如说是一个夫妻店,丈夫是程序员,夫人是设计师。虽然代码写得很一般,但是两个人赚着年薪五十万英镑的收入,生活在一个非常舒适的小岛上,真正地「面朝大海,春暖花开,写写代码,自由自在」。于是问题来了,为什么中国的很多程序员虽然也都实现了高薪,但生活得却非常压抑和苦逼,技术能够改变世界,却为什么不能改变自己的工作和人生呢?

这句话和这个故事让我感触很深,我也没有想到外表高大魁梧,非常技术反而的 Andy 也是一个非常有情怀而且有生活情趣的人。从监控宝,到透视宝,再到压测宝,这些产品把运维人员、运营人员以及测试人员从繁琐的工作中解放出来,真正提高 IT 生产力。

然而话说回来,马克思不是说过,人和动物最大的区别就在于人可以制造工具,而工具则真正的把人从繁杂的生活中解放出来的吗?

商业模式会死,但是技术永生。

原文  http://tech2ipo.com/10028789
正文到此结束
Loading...