书城计算机网络一本书读懂大数据
24612700000021

第21章 让数据张口说话,管理决策中的大数据(1)

管理不再是管理专家的专利,因为大数据时代的推动,数据取代了传统直觉式的决策管理,数据开始占领话语权的阵地。当企业管理转化为数据之后,客观数据统计结果才是最终成就企业,规避风险的利器。

客观数据最具发言权

二战时期的美国曾经在执行飞行任务上动用了大量的轰炸机,不少飞机都被地面的炮火击落,造成了大量的损失。飞行员的经验判断是由于主机翼的面积太大,地面炮火容易击中,可是如果在那上面再加装装甲,势必会导致重量过大影响飞机起飞。那要如何能既保护飞机,又能装上少量的装甲呢?为此美国军方内部的争论始终没有停止,最后只得请到了著名的统计学家沃德教授。

沃德先给每一名飞行员都发了飞机平面图,并提出让飞行员在平面图上画出弹孔的位置。飞行员画完以后上交时,沃德发现大多数的弹孔都集中在一张图上。那里几乎被打得千疮百孔,尤其是前机翼,可是在驾驶舱和飞机的水平尾翼上的弹孔却少很多。

看到这里,空军人员的意见就更为坚定了,他们要求在前机翼加上装甲,可是沃德教授的意见与之相左,他要求在弹孔最少的驾驶舱和水平尾翼装装甲。有一名飞行员出身的将军对此很不理解,说道:“教授的统计说明这两个地方最少受到攻击啊。”沃德教授回答道:“我们做统计的飞机都是安全回来的。从统计的结果来看即便是前翼被击中多次还是不影响飞行的。而这次统计很少被攻击的部分绝非没有受到攻击,反倒是因为被击中之后就坠毁了,无法统计。”将军听完仍然不同意,继续说:“尽管您的推断很有道理,但是从我的经验来说,当我还是飞行员的时候,机翼曾多次中弹,面临坠毁的危险,我的经验挽救了我自己。显然中弹概率最高的是机翼,我还是坚持我的观点。”

空军司令见两人的意见不统一很是为难。最后他还是决定接受沃德教授的意见,改进现有飞机的构造,在驾驶舱和水平尾翼后加装装甲。在采取了这一系列措施之后,盟军飞机的生存率大幅提高。为了确定这一策略是否正确,军方特地派出了特种部队和敌后抵抗组织到德国和法国等盟军飞机坠毁的现场去检测。结果显示不少飞机的坠毁确实是由于驾驶室和水平尾翼中弹导致的。

这次意见的对决很显然是一场科学方法和经验主义的对决,最后科学家的科学方式解决了问题。社会不断发展,大数据时代已经来临,很多数量化和科学方法从前无法解决的问题如今都有了解决的方案。大数据通常是借助计算机、各种数据采集工具、服务器、ERP信息系统等IT技术来获得大量的数据,再借由各种计算公式、统计方法找到解决的办法。

先来介绍一个数据解决疑难问题的例子。风险投资公司的名声不好,这往往是依赖本能感觉或是经验来做出的判断。风险投资的业务总是和各行各业相关,若是想要有一个量化的计算公式不太容易,更别说对各领域投资项目进行分析了。投资毕竟需要十分谨慎的态度,投资者寻求的方法必须是科学的,要去给有潜力的创业者和创业公司进行分析,评级和打分。

创业者的思想在投资者看来,要依据来寻求支持的创业者手机上的应用程序,浏览过的网站,还有读过的书籍来分析。首先了解他的大脑装了哪些内容,创业者阅读了多少书籍,在社交平台上又发布过什么样的内容等等。在投资者看来,创业者在社交平台上所发布的内容如果是有知识有水平的话,譬如引用了多数的名篇名句,创业成功的指数就会随之增加。

著名的风险投资家克里斯·萨卡曾说过,分析投资项目的时候,他会先去看看创业者在Twitter上最近发的50条信息,以此来推测创业者是什么样风格的人。他应用了精心设计的投资算法,创业者的表现被纳入了计算公式当中,数据的分析让他看到创业者是否值得信赖。

投资者还会依照创业者手机号码是何时开始使用,以及每天的第一通电话拨打时间来分析和推断。例如手机的使用年份可以揭示创业者的人脉资源和人际关系,年龄大约是多少,是否有亲情号码计划或是座机转为手机的经历。手机号码的使用年份一系列信息的处理,投资者能看到更多关于创业者的信息,整个过程是合法的且完全保密地进行。最后投资者理想中的创业者应该具备年轻的、稳定的,有中产阶级家庭背景的,且创业有家人和朋友支持的人。

挖掘潜力股的数据化进程

最重视数据的NBA,当中有众多运用数据的高手。

大多数在NBA征战的球队都有专属自己的数据统计人员,不过每支球队的统计团队规模不一,这和球队对数据的关注程度高低有关。其中最为重视数据的两支球队非凯尔特人和火箭莫属。此外在联盟排在前列的球队一般都有数据分析团队,那些不重视数据分析的球队总是在联盟中垫底。美国知名的体育电视台ESPN篮球比赛分析师翰·霍林格曾说过:“NBA在这方面的领军人物必然是火箭的总经理达雷尔·莫雷。”

2006年,才满32岁的达雷尔·莫雷受聘成为休斯顿火箭队的总经理助理,第二年他就正式出任总经理,当时为人们称为“少帅”。达雷尔·莫雷毕业于麻省理工学院的MBA,身高超过了1.95米的他居然没有任何的职业篮球经历。莫雷曾说过:“大学时期的我,任何一项运动都勾不起我对数学一般的兴趣。”

正因如此,莫雷本着对数学和统计分析的偏好,在获得麻省理工学院的MBA学位之后,创立了属于自己的体育统计和分析的数据研究公司。从那时起,莫雷就和篮球相关数据结下了不解之缘。凯尔特人特别聘请他管理球队的球票销售。工作十分出色的他在2002年就被凯尔特人队聘请为篮球管理运作副总裁。莫雷在这个职位上用数据统计和分析的方式选中了当时名声不那么响亮的韦斯特、杰弗森和杰拉德。一时间争议很多,但是此后三人的表现说明莫雷的选择是正确的。

加盟火箭队之后的莫雷更是引入了一种同步数据录入的技术,这样NBA最新最全的统计就可以获得了。在传统数据分析模型的基础上,莫雷带着自己的团队还会使用比赛录像模拟技术,简单说就是电子游戏的方式来演练。而这一切都是计算公式所编排出来的规则演练程序。就好比当火箭和国王在就前锋阿泰斯特交易谈判过程中,莫雷和他的团队用EA Sports的NBA游戏整个模拟了阿泰斯特加入火箭队之后的比赛情况,这才最后做了决定。

除此之外,莫雷还会通过统计学的模型对每一个上场球员的综合表现进行追踪和评价。莫雷对于自己是如何分析数据的从来都讳莫如深,可是所有人都明白他手中有一套完整的计算方法,其中最厉害的莫过于预测一个球员同球队配合时的表现。莫雷说过:“一个球员和球队的合作会是什么样的,我们无法决定。例如在棒球比赛当中,中场手只会是中场手,而在篮球比赛当中,一个球员在球队中的表现无论如何要想办法来预测。”

莫雷接手了火箭队以后也曾遭遇了很大的挑战,队中姚明和麦蒂的薪酬就占去了整个球队的40%,两人的状态也不是太好,因此球队在购买其他大牌球员上总显得有些捉襟见肘。可是莫雷想出了一个办法,他用自己独到的数据分析方式挖掘球队潜在的优秀球员。

2007年,莫雷在选秀当中放弃了当时最红的杰伦·戴维斯和约什·麦克罗伯茨,转而选择了身高只有1.80米的后卫亚隆·布鲁克斯。很多人对莫雷的举动表示不解,可是到了夏季联赛布鲁克斯的表现却让大家难以置信。最后布鲁克斯在那一赛季的表现压倒了当时包括“榜眼”凯文·杜兰特在内的诸多新秀,冉冉升起成了一名篮球新星。

莫雷后来又利用自己的方式引进了巴蒂尔、斯科拉、阿泰斯特等“价廉物美”的球员,火箭队在莫雷的带领下即便是麦蒂和姚明轮番缺阵的2008年1-3月,还是取得了22连胜,闯进了季后赛 。

时代因大数据而变革

统计学才是数据化的技术保障。统计学本身是一门基于搜索、整理、分析数据等技术手段,来推测对象本质或是预测对象未来的综合性科学。也就是寻找挖掘的对象,用数字标志来记录对象的现象,再汇总数据找到事物的本质和规律。统计学最为核心的思想是要汇总偶发性的一切事件,再找到必然的规律。很显然,一个事件的发生常常是偶然的,但是大多数事件叠在一起就会有必然性产生。

企业管理不论是从市场运营出发还是对人的管理出发,只要认真地审视每一个客户或是员工的表现,叠加在一起,规律就会自然而然呈现出来的。

统计学的发展经历了三个时期。最早统计学的概念产生于古希腊的亚里士多德时期,早期是用于计算和统计各个城邦王国经济发展水平和居民生活情况的。如今,在国家管理、企业运营和科学研究等多个领域统计学都在被广泛应用。在整个社会当中,统计学的发展大致可以分为以下三个阶段。

第一个阶段是城邦政情。有观点认为,最早应用统计学方法的记录是古希腊亚里士多德所撰写的“城邦政情”。早在公元前8世纪,古希腊就建立起了不少城邦为基础的国家。亚里士多德主张科学和数学管理,在抵御波斯帝国入侵的问题上,它们对各个希腊城邦的人口、军队、经济和粮食等方面进行统计,用于分析抵御外敌入侵的能力。很快这方法就传遍了欧亚各地,到了17世纪就发展为真正意义上的统计学了。

第二阶段是政治算术阶段。这一阶段最大的特点就是把统计方法和数学推算、推理相结合,对社会经济问题进行分析,其中更为注重定量分析方法的应用。直到现在,早期的“城邦政情”已经发展到了对国家和社会所有经济、社会发展的统计分析,现在大家所熟悉的GDP、CPI、基尼指数等等都是统计学上的重要数据指标。

拿基尼指数来举例。1922年意大利经济学家基尼提出了基尼指数,用于在劳伦茨曲线基础上来判断收入分配的公平程度。比例数值介于0和1,越是接近0就说明收入的分配越公平,反之则越不公平。长期的数据统计结果表明,只要一个国家的基尼系数超过0.4,就说明这个国家贫富差距大,社会不稳定因素多,常常会有失业、罢工等危机事件发生,如果高达0.6的话,那就说明收入相当悬殊。

第三阶段是大数据时代。在计算机和现代检测技术发展的今天,数据的提取已经不是难事。通过计算机技术,一个银行每天的客流量和业务办结情况可以随时进行统计。与此同时多个银行的信息还可以汇总到一起来进行分析。有了软件技术,客户的身份信息也可以快速转换为年龄、地址等等数据,很多的客户和业务都能被贴上信息标签。具备了这些,企业每天都可以累积庞大的数据,然后再通过网络和检索汇总成海量数据。因此大数据的概念产生了。

那些数量已经超越人工或是简单的计算机软件处理能力的庞大海量数据就被称作是大数据。例如有商场客户购买情况,搜索引擎上网民对某一条词条的搜索情况记录,还有全国性的人口普查等等。海量信息的出现,管理者不得不放弃原有单纯分析销售额和客户成交率的做法,转而去针对不同年龄、不同性别和不同地区的客户成交率的计算。

关于温度、压力、湿度、亮度、粉尘颗粒等信息检测技术会越来越方便,海量的数据就此被积累起来,用来对人们在不同条件下的行为变化进行分析。例如中国互联网络信息中心曾有过这样一项统计,到2012年12月底,中国的网民数量已经达到5.64亿人,普及率高达42.1%,和2011年底相比提高了3.8%。中国的手机网民的数量大致为4.2亿人,和上一年度相比增加了大约6440万人。2012年70.6%网民用台式电脑上网,和上一年底相比下降了将近3个百分点,相比之下手机上网增长数量比较快速,由上一年度的69.3%提高到了74.5%。此外百度的统计也显示,2012年度网民不同时间的上网活跃度依次为:20:00—21:00(6.53%)、21:00—22:00(6.44%)、16:00-17:00(6.20%)、19:00—20:00(6.13%)、15:00—16:00(6.09%),这当中在晚饭过后的3个小时(19:00—22:00)是网民最为活跃的上网时间段。