书城计算机网络一本书读懂大数据
24612700000013

第13章 生活无处不数据,大数据真的能算命?(3)

除此以外另外一点也是观察的重点。一个人的常态在变化的时候,是什么环境或是事件促使他变化的,这是必须思考的。譬如一个被警察抓到警察局的人,他必然会焦躁不安,且十分恐惧,动作也会变得粗鲁,但这不说明他必然是恶人,因为在判断时还要考虑环境因素。若是发生了一起爆炸案,那么究竟有没有什么异常的人在爆炸发生前后出现在现场呢?案发前是不是有异常逗留在现场的人呢?案发之后,如果有人受伤,很多人都凑过来救助,当中有两个行色匆匆,且表情淡定的人经过,那这两个异常的人就有很大的嫌疑了,无疑他们就是常态中的变态。

从人推“数”,观察数据时有以下几个问题不容忽视:常态的数据和时态的数据是什么?什么是骗人的数据?直观感受和细心观察后常常会得到大相径庭的结论。

依照通常的理解,一个人在注册某一网站填写性别的时候,不是男性就是女性。可是在阿里巴巴,谁曾想到性别标签居然有18个。

经过仔细的调查,用户性别的识别方法就浮出水面了。例如一般习惯在早上浏览的就偏男性一些,晚上浏览的则偏女性一些(很可能是妻子在使用)。真实中的性别仅有1和0之间的关系,现实却存在0-1的关系,70%的是男性,而30%的是女性。不同的场景性别会因为不同的原因而发生变化,例如搜索、社交和广告都会带来变化。“真实”性别在静态时,通过A/B测试的表现和动态虚拟性别相比有效性更差,这也正好说明了数据必须是运动变化的,绝不能仅是闭门造车,阿里巴巴类似这样的案例实在太多了。

说到数据化运营,通常在公司内部流程是这样的,比如一个童装项目需要通过营销推广来招揽新客户。第一步要做的就是定位客户群,努力找出所有对此项目感兴趣的消费者标签,向他们发送邮件或是短信引起他们的注意。而这一流程便是数据化运营,企业利用这方式来解决问题。最为简单的解决方式就是找出所有曾经对此感兴趣却没有产生消费行为的客户群,再比如用关联类目来扩大自己的目标客户群。

“用”升级为“养”,这就是运营数据,阿里巴巴用这种方式在淘宝用户中寻找。举12岁以下儿童商品为例,淘宝会在自己所有的用户中搜索家中有12岁以下孩子的消费者,他们的重要特征是从未有过此类目商品的购物行为。这样一来,从前只在有过购买行为的用户中运营,如今一下子用户就会扩展几十倍,从几百万到几千万,运营数据的结果就是这样,它从主动收集手机数据开始,到运营数据,最后的结果是产生新的数据。

大家广泛理解的数据运营本身就是个不断的循环。循环的过程当中,总会产生不少新的、不同维度的数据,而在这个循环当中,数据也在不断地适应,这才能运用到数据化的运营当中,将从前的运营方式彻底改变。大数据落地的方式或许正是如此。

假定数据是稳定的,这是数据化运营的前提,这也可以用来改变企业的运营模式。从前唱主角的是结构化的数据,例如绝大多数的企业总是在企业运营中使用财务数据,多年沉积下来的财务数据相对而言比较稳定。可是在数据化运营下,由于非结构性数据和半结构性数据的产生,难度就增大了,例如音频就是典型的非结构性数据,而且它也很难转化为结构化数据,这样的数据产生之后,企业运营若是依赖数据的话,其中的技术难度可以想象。

稳定的数据是进行数据化运营的基本前提,相比之下,运营数据则需要可获取的数据,它们必须是不稳定的。

这话该怎么解释呢?比如说关键词ROI,尽管这是一个听起来很稳定的数据,但是其反映的却是短线利益。商业是数据化运营要紧紧依存的对象,数据和商业混合在一起,再用假设稳定的方式进行业务对比和细分,还有趋势估计。

这不代表稳定就全是对的,毕竟在企业对数据的运营分析中很多稳定因素都需要假定存在。

网络数据背后的价值

很多具体领域中,企业要了解它们的顾客的途径是网络数据。驾驭不来大数据的企业是无法洞察他们顾客的特点的。接下来就来好好明确一下能通过网络数据来洞察的领域。

先来说说购物行为。顾客为何会进入这个网站并开始购物行为,这是理解顾客购物行为的最佳起点。顾客使用的是哪种搜索引擎,搜索时输入的是什么关键词呢?他们之前收藏的书签又有哪些呢?这全部的信息是分析专家寻求模式的依据,譬如产品的销售量同哪些关键词,哪些搜索引擎,还有哪些推荐网站彼此关联。分析专家更为重视的不但是要查看哪些产品在给定的网页中拥有高销售额,更要看看哪个时期同一顾客的购买行为更多。网站的销售和顾客的购买行为两者跨渠道地结合就是最终的价值。

顾客登录网站先要做的就是浏览所有看得到的商品。专家在处理数据的时候要做的是甄别顾客是在看了哪些商品的登录界面后离开的,而还有哪些顾客会继续浏览,哪些人又继续看了附加图片,阅读了产品评价,浏览了产品的详细说明,看了运输信息,又利用了网站上的其他可用信息等等也要了解。就比如,要鉴别一下进行比较的是哪些产品,最后鉴别出来的商品又是如何被移入购物车,或者是被从购物车中移出。

网络数据是无可替代的,顾客接下来会购买什么,又是如何进行决策的,它都可以告诉人们。了解了这些显然可以帮助企业促使顾客完成尚未完成的交易。顾客由此几乎会认定自己在购买商品的时候,企业已经了解了他们的想法。

网络数据还有一个非常有趣的功能,顾客在购买行为之前会因为它发现自己感兴趣的商品被捆绑在一起。在购买行为完成以后再为其推销商品的做法已经过时了。而现在的做法是在第一时间就让顾客浏览到自己所要查看的商品,还将其感兴趣的商品捆绑起来。

就例如有一个正在浏览电脑、备份硬盘、打印机和显示器的顾客,看起来他是想要升级自己的PC系统。很显然,商家就要为其提供一整套顾客浏览过的部件套装。不能在顾客已经决定了购买电脑后再提供这些信息。购买之前,为顾客提供的定制捆绑优惠策略远胜于那些在购买行为之后推荐通用配件的做法。

再来说说顾客的购买习惯和途径。网络数据可以收集、分析和查看顾客在网站上的浏览历史,也就能把顾客购买决定之前的过程都弄清楚,从中还能发现顾客的购买偏好。以航空公司为例子吧。顾客预订的机票可以帮助航空公司来了解顾客的偏好,其中包括顾客会提前多久预订机票,预订的是哪些舱位,是不是跨过周末的航班。所有的信息对于航空公司都是十分有用的,网络数据能让他们获得更多的信息。

航空公司从中能发现看重便利性的顾客是哪些,通常这些顾客的做法是找到特定时间的直飞航班。除非是价格悬殊,但便利性的获得却只有一点点的时候,他们才可能放弃便捷的直飞航班。一个在纽约JFK机场转机的乘客,如果选择直飞LaGuardia机场会节约700美元,而这期间他需要耗费30分钟在JFK机场,额外的出租车费用仅仅是20美元。如此情形下,重视便利性的顾客会选择在JFK机场转机承受一切麻烦,只为了省下700美元。假使差价仅仅是200美元,且放弃的话到达目的地的时间要晚2个小时左右,那么同样的顾客他所做的选择就会是最便捷的直飞。

哪些乘客价格至上航空公司也可以分辨出来,他们的习惯是从中搜索出价格最优的航班。只有一种情况会让他们违背价格优先考虑的原则,那便是可以用牺牲适度的价格来提高便利性。譬如,一个顾客选择上午10点出发,航班的价格是220美元,6点的航班价格是200美元,如果要让他牺牲四个小时的睡眠来省下20美元的话,显然他还是会放弃价格至上的原则,愿意付出20美元的溢价。

航空公司基于搜索模式就可以了解顾客的购买习惯是偏向价格还是偏向特定的目的地。一切在于顾客是否对所有特价机票都有所了解的情况下才选择了其中的一张,还是只是看到了某一特定目的地的机票就立刻购买呢?一个大学生,对他来说春季假期旅行的目的地,很多地方的意义都是相同的,那他一定会先选择最为优惠的那个。可是对于定期回家的顾客来说,目的地才是他最为感兴趣的因素。

企业如果能了解顾客最经常在网站上浏览哪些目的地的周末特价机票的话,那要推测出顾客的购买偏好并非难事。很多顾客随时都有回家的时间,那么他们就会很是关注飞往特定城市的特价机票。只要有特价机票的话他们就会立刻预订。航空公司通过识别这个模式,就可以很好地预先了解顾客的需求。

所有上面提到的这些例子,其实都是在考虑怎么把现在浏览和研究的模式,与以往的历史经验和购买记录彼此结合,带来更多的惊喜价值。只不过如此模式的分析流程要改变的话需要耗费大量的时间和努力。只是网站吸引不同顾客的方方面面被知晓后,就可以很容易地向已经被定位的顾客发送他们最感兴趣的信息,充分地满足顾客的需求。

再说说研究行为。要和顾客个体进行交互的话,前提是要理解他们是如何利用网站内容的,除此外还可以帮助理解网站的哪个部分因此获得了销售的提升。顾客在购买过程中所探究过的选项是推测他们重视的因素的重要依据。

就举一个专门做电影销售的在线商店为例。假如顾客在做出购买决定之前首先习惯去查看视频有哪些格式,像是有标准格式、宽屏、扩展或是高清格式,也就是说绝大多数时候,他们更青睐某一种格式的视频。但事实上,他们对格式并不在乎。那么,网站可以每一次都为查看过所有格式视频的顾客提供不同的版本。那究竟是为什么还要让顾客在众多的版本中挑选呢?事实上某一类的顾客他们已经习惯了购买一种特定格式的视频了。

要对顾客进行研究的话,利用网络数据还有另一种方法,那就是在网站上的所有信息中鉴别哪些对顾客,特别是重要的顾客有重要的价值。在购买之前,顾客会有多高的频率去查看评论、附加图片和技术说明呢?只要跟踪不同的会话,再结合顾客的其他数据,就能了解顾客购买的整个流程,在哪一天进行查看浏览,哪一天完成购买行为。最终的购买行为已经是指向十分明确的网络会话了,因为交易因此而完成。网页浏览的历史可以拼出一张完整的图像。很多时候企业试图去除网站上的一些极少被用到的特性,可是这些对某一类重要的顾客来说确有十足的价值。如果是这样,这些特性就不会被剔除掉。

至于顾客在购买行为发生之前到底对自己想要购买的商品进行了多少调研,这些也不再依赖昂贵、小型的调查了。网络数据能够为企业分析出每一个顾客个体或是群体最重视的因素,并且还能规避掉很多顾客言行不一带来的风险。这样一来真相就显现出来了。

顾客的一些异常行为会被企业所发现,有时候顾客会详细查看某一产品的说明,随后又没有购买,反而是那些未曾看过产品说明的顾客却没有这样做。很可能是因为在查看了产品说明之后,从中发现有些描述还不够详尽,或者是说明中还存在疏忽等等,总之升级产品描述的话无疑对提高销售业绩是非常有帮助的。

其中有一个重要的指向标,那就是阅读评价,顾客所看重的特征都可以从中发现。顾客看重的是哪些评价,又不在乎哪些评价?哪些商品在顾客阅读了商品评价之后就不再购买,又有哪些商品评价是可以帮助提高销售额的?一旦发现有人在阅读了某些评价之后放弃购买或是决定购买某商品的话,那这些评价就要留心了。也许会有负面的评价出现,而对于网站而言核实这些评价是必要的,他们提出了哪些问题,就要想办法去处理掉这些问题。

最终顾客所看重的网站特性也要弄清楚,还有顾客在网站上如何浏览商品也是必须了解的,网站只有这样才会贴近顾客。那些重视详细产品说明的顾客,必须让他们一看到商品就会立刻去浏览产品说明。而那些习惯去浏览图片的顾客,必须为他们提供全尺寸的图片而不是缩略图。最重要的是要为顾客提供搜索和查看的便利,只有这样顾客才会在做购买决定的时候选择自己而不是选择其他商家。

最后来说说反馈行为。对商品和服务的详细反馈信息是顾客为网站提供的信息中最有价值的。顾客确实很愿意为自己所钟情的品牌去做这件事情。从文本当中发掘顾客反馈时所用的语气、意图和主题,就能明白顾客之所以看重它的原因了。

顾客在购买商品之后,会不会照惯例去发表评论呢?评论如果是积极的,还有其他的很多顾客阅读到这些评论,这些顾客从中所获得的特殊激励显然是公司最明智的做法。其他类似的还有顾客在线求助会话中的问题和评论,通过分析就能知道顾客普遍要了解的是什么,也可以知道特定顾客需要了解的是什么。特定顾客所看重的特征一旦被发现,那就可以有针对性地为其推荐相类似的商品了。

通过顾客在各个渠道上发表的评论和问题,可以了解他们的好恶,还包括譬如他们是不是Facebook的粉丝,在twitter上他们是不是彼此关注?此外,网站如果发现了在各个社交媒体上积极地发表正面评论的顾客存在,那么网站就可以着力将其培养成最具影响力的推广大使。企业品牌的影响力的提升,值得企业花时间精力去做这样的付出。顾客的影响力和个人的价值之间并不一定是密切相关的。比较活跃的客户一般都是享受标准待遇、规模中等的客户,实际他们为销售所带来的价值已经远远超过了他们的影响力,剩下要企业做的就是提升这些客户的待遇级别。