转载

金柚网邱燕:数据的质变起点,从数据陈列到数据统计

“互联网+”时代 ,人人都在谈大数据。6月16日,HRoot中国人力资源服务展(深圳站)会上,金柚网COO邱燕针对大数据在人力资源管理行业的深入渗透,就目前企业管理在面对数据应用时的现状和困惑,发表了题为《数据时代的质变起点:从数据陈列到数据统计》的主题演讲。通过剖析企业管理难点,以大数据、云计算的信息化手段来帮助企业理清现代人事管理之路。

以下为内容分享:

在公有云作为基础设施日益成熟的当下,基于云架构基础上的大数据应用,成为现实的可能。只是从知识到趋势,再到真正的落地应用,是一个逐渐的过程。这里,我将金柚网在推进产品过程中对大数据应用的落地思考与探索与大家做一个简单的交流与沟通。

在大数据领域,2010年之后,谈论的人越来越多。一般的,我们说的大数据即海量数据,其特性,这里采纳IBM公司对Big Data特点的思考作为观察视角,即数据量(Volume)、时效性(Velocity)、多样性(Variety)、可疑性(Veracity)。

我们在谈论大数据时,从商业的角度,多与互联网、云计算、SaaS、移动、物联网进行关联讨论;从技术设备的角度,多与移动设备、RFID、移动传感器进行关联讨论;从数据存储、数据处理的角度,多谈论存储系统分布式缓存、基于MPP的分布式数据库、分布式文件系统、各种分布式存储方案等内容。

但谈到大数据落地的应用部分,尤其是怎样才是落地应用和如何落地应用,并不是很多。商业模式是前瞻性的方向思考,技术是实现的具体手段,将前瞻性的思考与技术手段的结合过程,是容易被我们忽略的落地方法。以思考作为方向指引,通过方法的探索,有选择的使用具体的技术手段,这三者之间结合起来,才可以真正帮助并推进我们通过大数据应用改善生活达到效率的变革。而怎样落地和如何落地,是与大数据应用的方法关联在一起的。

大数据被人应用的前提,是工具化的“落地”。即海量数据成为一种工具,可以成为达到、完成或促进某一事物的手段。考虑到原始人制造工具的过程,我们可以说,所有工具的出现,都存在工具使用者基于观察,对“客观存在”的取材、打磨、思考、制造与最后的使用。这一过程,需要时间,尤其需要我们的耐心。

大数据应用,在我看来,是大数据成为人们观察、思考、分析的工具,并在某种程度上成为人们行动的指引,即成为人们认知事物及解决问题的工具。从数据陈列时代进化到数据统计时代,是大数据应用质变的起点,即静态冰冷的Big Data进化到可以参与认知世界和解决问题这一动态过程中来。

可以说,所有的事物都是从静态进入到动态的互联。大数据的应用,也是如此。早期的大数据应用,从广义上讲,一定是从某个具有相对边界的区块应用开始的。然后多区块在信息的物理互联(如光缆、传感器、集成电路等)的推进影响下,开始发挥更大规模的并行与协同应用。例如多触感信息同时通过网络并行传输,进入中央处理的神经系统。

金柚网邱燕:数据的质变起点,从数据陈列到数据统计

所以,具有相对清晰边界内的应用,是大数据应用的早期。

需要留意的是,当所有数据都关联在一起的时候,因为部分数据点出现了重合,那么,在强关联之后,部分重合的数据或部分重合的功能,可能会被更强的系统完全取代掉。在纯数据层面以及部分以数据为支撑的功能层面,的确存在多维度对低维度强硬取代的可能。

说到早期应用,其实已经开始了。例如购物网站,通过设立分析基点,对购物者的行为数据进行基于统计基础上的计算与分析,并向购物者推送可能符合购物者购买意图的产品,可以看到,推送的内容,已经越来越准确和符合购物者的常规关注取向。我们看到,滴滴软件,从早期相对初级的叫车工具,通过对叫车人出没地点的取值及后续的统计与计算,开始能够在出行数据的统计分析基础上,对出行者可能的出行轨迹与习惯进行跟踪和分析,并智能化的推送可能的地点给出行人做选择参考。

购物的前置推送、出行地点的前置推送,都是典型的大数据应用。我们甚至可以说,这两个领域的大数据应用,因为前置推送所代表的行为预判,正在从工具的机械化逐渐过度到工具的智能化。

我认为大数据的早期应用,一定要经历4个必经的阶段,这四个阶段的逐渐深入,就是大数据应用的开启与深入:

生活中所有的行为往复都会出现大量的数据,这些数据是语言和行为共同生产出来的,在某一个时间点上的静态结果。留意到这些相对静态的数据,就是对数据开始了观察。

通过观察,我们看到了数据,考虑到可能的使用,我们需要对这些数据进行收集,好方便进一步观察与思考。可以说,这是一个相对简单的归拢阶段。

数据收集过程中,随着数据量越来越大。尤其是以海量数据为表征的大数据,展现或者说陈列,就是一个大问题。量太大的数据,能够归集后并清晰的展现,本身就是一个挑战。就像我们电脑上有越来越多的文件,将这些文件以清晰的形式进行陈列展现,说起来简单,其实并不容易,所以大多数人电脑里的文件总是一团糟。

清晰陈列的前提,是需要有基本的分类,这就将观察引入了一个深的具有管理意味的领域,因为分类的前提,是对客体基于某种逻辑基础之上的分析;没有在一定基础上的共性思考(即脱离客体具象的抽象思考),也就无从分类。

有了数据的陈列,和基本的陈列性整理,数据之间的逻辑性得以展现。在一定的统计口径之下,就可以对这些数据进行统计。

在谈数据统计之前,我们先就何为“统计”做一个简单的描述。以百度百科上的描述作为参考:“统计,指人类对事物数量的认识形成的定义,简单说,就是通过图标或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间的关系进行估计和描述。” 通过统计,我们可以看到事物的集中趋势、离中趋势、和其他相关趋势。简单来说,即统计,帮助我们认知事物的整体面貌与发展趋势。

统计,是一种基于数据的数量分析与关系分析,是相比于初级的逻辑分类,有更为明确指向的逻辑意图。这个意图,就是上面提到的,对事物趋势的观察与思考。

统计的口径,本身需要设计,设计本身,是对设计元素的某种重组加工。所以,可进入设计的数据组,就具有了重组的可能。即,基于设计的数据,口径的不同,将形成不同的重组逻辑。举个例子,同样的数据,如果统计口径采纳的数据不同,会展现完全不同的逻辑结果。

如果我们以数据,来理解抽象的逻辑,那么,数据辨识阶段,对应的是逻辑的点;数据归集阶段,对应的是逻辑的线;数据陈列阶段,对应的是逻辑的面,而数据统计阶段,因为可根据口径的不同来进行逻辑重组,对应的就是逻辑的“立体”状态。

从物理学维度的角度看,站在立体多维的角度,将可以轻松的理解低维度的“点”、“线”、“面”。以“立体”的维度,逆向理解低维度的数据,如果这些数据,关乎行为,那我们就可以尝试对行为从数据逻辑的角度进行解构。这一过程,因为正向与逆向的反复冲荡,我们就可能通过数据,重新理解行为,并对行为的过程,进行建模处理。

金柚网邱燕:数据的质变起点,从数据陈列到数据统计

一旦进入建模阶段,考虑到更为抽象的模型之间,本身也是有某种逻辑关系,这样,我们就可以从更高的维度层面,对很多事物和行为进行预判。而预判及预判隐含的引导,就使大数据工具,具有了智能的特性。

这里,我们先将智能,做一个简单的解释,一般说的“智能”,是从感觉到记忆到思维这一过程,称为“智慧”,智慧的结果就产生了行为和语言,行为和语言的表达过程,是一种“能力”,两者合称为“智能”。

正是在这个意义上,我非常喜欢滴滴软件。滴滴从早期的叫车软件,通过不断的迭代和功能演化,可以看出滴滴的底层数据与功能,拆分的非常清晰。目前市场上主要的应用软件,核心还是在数据历史与数据陈列上。滴滴已经可以做到通过数据取值后的统计分析,先行推送可能地点给乘车人。对比我们上面提到的“智能”的简单内容,滴滴通过其软件作为“语言”并将其计算过的建议“表达”给我们这些乘车人。所以,我觉得滴滴软件,是有智能的。

滴滴软件的这种“智能”,就是典型的大数据应用。

大数据应用的质变起点,就是从数据的相对静态陈列,到对数据进行逻辑分析以及对应基础上的统计陈列。数据统计中,有计算、有分类、有分析、有重组,这样,就对静态数据进行了立体观察,从而能够在海量数据的迷雾中,找到相对清晰的逻辑关系。多方位放大这种逻辑关系的视角,(例如,一个人一天的出行,放在一个大时间周期中对其可能的出行做分析和预判,就会出现有一定数据依据的个人的出行模型/模式),从而使得软件可以在模型指导下进行预先性的“表达”,即我们看到的购物网站的推送和滴滴软件的出行地点建议。这种表达,就是软件具有了某种“智能”。

简单说,大数据应用的质变起点,就是大数据作为应用工具,开始从静态的机械化到动态的智能化,这一过程中的关键点,是大数据进入了数据统计阶段。没有数据统计作为基本的立足点,大数据将依然处于静态阶段而等待被发掘。

真正有应用价值的大数据应用,一定是基于数据统计基础上的智能化的应用。

坦白讲,所有的行业,只要是人与人之间互动并在互动中产生海量数据的,都是可以被大数据应用进行效率改造的领域。不同的是,相对于出行,人力资源领域的数据量更为庞大,可以说,进入大数据应用道路中的迷雾更多。

出行,可以积累的数据,有路线、出行地地,上车时间习惯、消费水平习惯、车型选择习惯等数据。人力资源的数据,单入职手续,一个人的静态数据,可能就包含个人身份、院校、喜好、工作经历、社保关系、银行账号等近100个静态类数据。而这100多个静态类数据,仅仅是入职的一瞬间的针对入职员工的采集。后续的行为、人与人之间的交互、工作的交互、公司内部与外部、公司部门与部门之间,这些内容,有交互本身产生的海量数据,还有支撑交互所需要的专业的更大规模的海量数据。

早期,在各种功能性软件的帮助下,数据是有基本的罗列。但从大数据应用的角度看,B端业务各个部分数据的准确分拆,目前是一个刚刚起步的阶段。以思考作为方向指引,通过方法的探索,有选择的使用具体的技术手段,这三者之间结合起来,才可以真正帮助并推进我们通过大数据应用改善生活提高效率并达到变革。从数据辨识、到数据归集、到数据陈列、再到数据统计,是一个逐渐的过程,很难跨越。某一区块内开始的大数据应用是人力资源领域利用大数据的突破点。即便如此,难度也比较大,考验的可能不是技术,我相信没有技术实现不了的设计,而是耐心和专注力。

金柚网邱燕:数据的质变起点,从数据陈列到数据统计

找到突破口,以及突破口中最实质的内容,进行数据分拆和搭建,是一个可以落地的方法。例如,我们金柚网希望能够帮企业解决人力资源领域中繁琐工作对接与专业统计问题,我们选择的突破口,是社保管理,而社保管理中最实质的内容,是虽繁复但要求精准的社保计算。金柚网的社保计算器在数据底层,经历了半年的确定定义、拆分、重组和设计,目前,我们的社保计算器,是国内第一家将社保计算推进到了省、市、县/区、不同户籍四级递进的在线社保计算器。即将上线的金柚网天吴系统,为参保人提供了详细预收以及与之对应的详细实缴账单,精确度到了分和角,且是时时计算。

我们相信,系统化的帮助企业HR解决繁琐工作,将可以把企业HR从重复的繁琐工作中解脱出来,从而帮助企业将更多的专注力,放在可以真正的服务好员工、提高员工“生产能力”上,进而帮助企业真正的提高自身市场竞争力。

总之,B端业务难度非常大,进行大数据应用的深入思考就更为重要。数据量越大,如何观察和陈列这些数据,以及统计哪些数据,是对我们理解整个人力资源体系本质工作的一个挑战,也是对我们理解人与人之间关系的一个挑战。当然,处理好数据之间的关系只是一个方面,作为工作展现,如何让软件的实际操作人,能够拥有最简单的操作路径,是另一个工作挑战。金柚网将整个社保管理的展现模式,进行了嫁接性的创造,我们将购物的操作路径,引入到了社保管理尤其是社保缴纳这个环节。对客户来说,操作社保这个工作,将基于现有通行的购物体验;而客户需要了解的工作进度,将在订单详情中进行详细展现。会网上购物,就会操作金柚网的软件。

找方法很重要。方向、方法、技术手段,三者只有互相支撑,形成牢固的三角关系,才能使产品真正派上用场。这一直是金柚网努力的方向。考虑到组成人体的2.5万个基因和30亿对碱基的秘密都可以被破解。相信我们大家在找到正确的方法后,一定可以靠耐心、创造力和不懈的学习,共同帮助人力资源领域逐渐摆脱行政事务性工作,从而通过大数据应用,进入到提高人本效能的新时代。

正文到此结束
Loading...