书城投资理财数字化营销
44989700000026

第26章 数据挖掘:数字化

营销成功的基石

网络化经济时代是“信息爆炸”时代,这使得企业管理者获得信息的数量剧增。然而,很多信息是垃圾,而不是有用的资源。

业务信息(尤其是客户信息资源)是一个企业最大的财富之一,如何掌握和利用至关重要。企业必须将分散的信息进行集成,并对之进行深度的开发和利用,使之成为企业经营中取之不尽、用之不竭的宝藏。

在市场经济比较发达的国家和地区,许多企业都开始在原有信息系统的基础上通过数据挖掘对业务信息进行深加工,以构筑自己的营销竞争优势,争夺客户资源,扩大自己的营业额。

一、数据挖掘概念

根据W。J。Fraw1ey和G。P。Shapir O等人的定义,数据挖掘(Data Mining)是指从大型数据库的数据中提取人们感兴趣的知识,而这些知识是隐含的、事先未知的、潜在的有用信息。

数据挖掘的提出最初是针对大型数据库的,这些数据库容量可能达到GB(109)字节,甚至TB(1012)字节,最近IBM提出其数字图书馆的数据将可能达PB(1015)字节。

从更广义的角度来讲,数据挖掘意味着在一些事实或观察数据的集合中寻找模式的决策支持过程。因而,数据挖掘的对象不仅是数据库,还可以是任何组织在一起的数据集合,如WWW信息资源等。目前数据挖掘工具能处理数值型的结构化数据,而文本、图形、数学公式、图像或WWW信息资源等半结构、无结构的数据形式将是数据挖掘的挑战之一。

商业“数据挖掘”是一种新的商业数字化处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘技术在企业市场营销中得到了比较普遍的应用,它是以市场营销学的市场细分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”。

通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销。这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。

二、数据挖掘在营销领域内的应用营销数据挖掘是一种决策支持过程。它从大量数据库中发现并提取隐藏在内的合理的、有效的信息,帮助营销人员寻找规律,发现被忽略的要素,预测趋势,进行决策。

(一)挖掘营销信息

消费者的信息来自市场中的各种渠道。例如,每当我们用信用卡消费时,商业企业就可以利用数字化管理系统收集商业消费信息,记录下我们进行消费的时间、地点、感兴趣的商品或服务、愿意接收的价格水平和支付能力等数据;当我们在申办信用卡、办理汽车驾驶执照、填写商品保修单等其他需要填写表格的场合时,我们的个人信息就存入了相应的业务数据库;企业除了自行收集相关业务信息之外,甚至可以从其他公司或机构购买此类信息为自己所用。

这些来自各种渠道的数据信息被组合,应用以超级计算机、并行处理、神经元网络、模型化算法和其他信息处理技术手段等组成的数字化管理系统进行处理,从中得到商家用于向特定消费群体或个体进行定向营销的决策信息。这种数据信息是如何应用的呢?例如,当银行通过对业务数据进行挖掘后,发现一个银行账户持有者突然要求申请双人联合帐户时,并且确认该消费者是第一次申请联合帐户,银行会推断该用户可能要结婚了,它就会向该用户定向推销用于购买房屋、支付子女学费等长期投资业务,银行甚至可能将该信息卖给专营婚庆商品和服务的公司。

在市场经济比较发达的国家和地区,许多公司都开始在原有信息系统的基础上通过数据挖掘对业务信息进行深加工,以构筑己的竞争优势,扩大自己的营业额。比如,居住在伦敦的持卡费者如果最近刚刚乘英国航空公司的航班去过巴黎,那么他可能会得到一个周末前往纽约的机票打折优惠卡。

由于管理信息系统和POS系统在商业尤其是零售业内的普遍使用,特别是条形码技术的使用,从而可以收集到大量关于用户购买情况的数据,并且数据量在不断激增。对市场营销来说,通过数据分析了解客户购物行为的一些特征,对提高竞争力及促进销售是大有帮助的。利用数据挖掘技术通过对用户数据的分析,可以得到关于顾客购买取向和兴趣的信息,从而为商业决策提供了可靠的依据。数据库数据挖掘在市场营销业上的应用可分为两类:数据库营销和货篮分析。

数据库营销的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客以便向它们推销产品,通过对已有的顾客数据的分析,可以将用户分为不同级别,级别越高,其购买的可能性就越大。为进行营销分析,首先必须将已有的用户信息进行手工分类,分类的依据可以由专家根据用户的实际表现给出,得到训练数据后,由数据挖掘进行学习,最后将用户进行分类。当一个新用户到来时,可以由已经学习后的系统给出其购买可能性的预测结果,从而可以根据结果有针对性地对顾客进行推销。

货篮分析是分析市场销售数据(如POS数据库)以识别顾客的购买行为模式。例如,如果A商品被选购,那么B商品被购买的可能性为95%,从而帮助确定商店货架的布局排放以促销某些商品,并且对进货的选择和搭配上也更有目的性。这方面的系统有:Opp Ortunity EXp10rer,它可用于超市商品销售异常情况的因果分析等;另外,IBM公司也开发了识别顾客购买行为模式的一些工具。

Internet的迅猛发展,尤其是Web的全球普及,使得Web上信息量无比丰富。Web上的数据信息不同于数据库。数据库有规范的结构,如关系数据库的二维表结构。毕竟数据库的创建是为了机器可读,因此有统一的格式,它是一种结构化的文件。Web上的信息则不然,主要是文档,它初始创建的目的是为了人类使用。文档结构性差,好者半结构化,坏者如纯自然语言文本则毫无结构。因此,互联网上的数据挖掘需要用到不同于常规数据库开采的很多技术。

互联网上的数据挖掘也称“信息搜索或查询”。它的一般过程是,用户向系统提出查询条件,系统调用搜索引擎开始工作,然后把搜索结果提交给用户。根据用户希望查找的对象可分为两种:资源发现和信息提取。前者目的在于根据用户要求找出有关的Web文档位置;后者则是能自动从有关文档中抽取出满足用户需要的信息。数据挖掘本质上是网络搜索,关键在于自动生成Web文档的索引。典型的索引生成系统有Web Craw1er和A1ta Vi S-ta等等,它们能对上百万数量的Web文档进行索引,文档中的每个单词的倒排索引均保存起来,技术上类似全文检索。用户通过输入关键词就能对所有建了索引的文档进行检索。目前常用的索引系统有十几种,用户输入同样的关键词在不同的索引下可能会得到不同的返回结果。为了提高搜索的准确度,技术人员又开发了一种建立在上述索引系统之上的高层系统——Meta Craw1er,它能并行地把用户输入的关键词提交给9种不同的索引系统,然后把这9种系统的查询结果进行对照比较,最终选定最佳结果返回用户。目前这方面的研究主要有两个方面:研制新的更好的索引系统、利用已有索引系统或搜索引擎(如Yah OO)开发高层次的搜索或发现系统。相比之下,后者的研究更为活跃。从技术上看,自动文档分类或归类方法将对这方面的研究有很大作用。

用户使用数据挖掘获取信息的过程中需要不停地从一个互网站点通过超文本链接跳转到另一个站点。这种过程存在一定的普遍性,此规律即是“互联网用户访问模式”。这是一种完全不同于上述所讲的数据挖掘的任务。理解互联网上的用户访问模式有这些好处:辅助改进分布式网络系统的设计性能,如在有高度相关的站点间提供快速有效的访问通道;能帮助更好地组织设计Web主页;帮助改善市场营销决策,如把广告放在适当的Web页上或更好地理解客户的兴趣。

(二)成功应用的案例

有很多公司都成功地安装了数据挖掘工具。早先采用了这种技术的公司大部分都是信息密集型公司,比如金融服务和邮件营销系统,但是现在这种技术已经准备好应用于各个公司中,只要公司具有大型数据库,并且有强烈的通过数字化系统改善公司管理的愿望。但是采用数据挖掘技术,公司必须两个关键的因素,一个就是大型的、集成化的数据库;另一个就是定义完善的商业处理程序,这样数据挖掘才好紧密地应用于公司数据之上。

一个药品公司,通过对它最近的营销强度和销售结果的分析,来决定哪一种营销活动在最近几个月内对高附加值的医生群体影响最大,这样的分析建立在竞争对手的销售活动信息和当地健康状况的数据系统之上。然后这个药品公司可以通过其办公网络,将分析结果传达到各地的销售代表处,销售代表们则可以根据公司传递的关键信息来作出相应的销售抉择,这样,在快速变化的、动态的市场上,销售代表们都可以根据各种特殊情况的分析作出最优的选择。

一家拥有很大直销队伍的运输公司,使用数据挖掘以确定其服务的最好模式。用数据挖掘来分析他自己的客户体验,该公司可建立唯一的客户分类方案以确定高效益的预期。对诸如由邓白氏(Dun&Brad Street)提供的那些一般商务数据,使用这个客户分类方案可以产生一张按地区排列的优先列表。

每一个这样的例子有一个共同清晰的基础,他们利用在数据仓库里隐藏的关于客户信息,来减少费用并改善客户关系的价值。这些组织现在可以集中精力于最重要的客户和有前景的商务,并设计可以最好实现这些目标的市场策略。

三、数据挖掘的营销价值

(一)数据挖掘是利润中心

数据挖掘应用系统,能够较好地改善客户关系。大型数据仓库全面集成了客户、供应者以及市场信息,导致了公司内的信息呈爆炸性增长,企业在市场竞争中,需要及时而准确地对这些信息作复杂的分析。为了更加及时地,更加准确地作出利于企业的抉择,建立在关系数据库和联机分析技术上的数据挖掘工具为我们带来了一个新的转机。目前,数据挖掘工具正以前所未有的速度发展,用户群体不断扩大,在未来越加激烈的市场竞争中,拥有数据挖掘技术必将比别人获得更快速的反应,赢得更多的营销机会。

以美国运通公司为例。它有一个用于记录信用卡业务的数据库,数据量达到54亿字符,并仍在随着业务进展不断更新。运通公司通过对这些数据进行挖掘,制定了“关联结算(Re_1ati On Ship Bi11ing)优惠”的促销策略,即如果一个顾客在一个商店用运通卡购买一套时装,那么在同——个商店再买一双鞋,就可以得到比较大的折扣,这样既可以增加商店的销售量,也可以增加运通卡在该商店的使用率。

一个信用卡公司利用他巨大的客户交易数据仓库来确定客户对新信用卡中最感兴趣的产品。使用一个小型的测试邮件,就可以确定一个客户对新产品的亲和力属性。最近一项调查表明,采用超常规的方法对指定目标的邮寄活动,可以节省20倍的费用。

(二)数据挖掘有利于提高客户满意度通过对客户的需求特征、购买记录、服务记录、接触历史等信息的记录与数字化管理,我们可以针对每一个客户的特点进行沟通并提供个性化服务,即进行一对一营销。在与客户交互的每一过程中,计算机系统会自动收集客户信息,整理客户所购商品的信息,分析客户偏好,找出客户行为模式,更好地为客户服务。提供售前、售中、售后三个阶段的个性化服务,全面提高用户满意度,加强客户关系。个性化服务的主要内容有:交易之前针对客户的特殊情况和偏好来推荐商品;交易中,根据客户情况进行服务,例如:向长期顾客提供优惠、折扣、附送礼品等;交易后,不时用E-mai1询问情况,征求意见,推荐新产品。

当然,实行这种个性化服务的关键技术在于对顾客信息的收集、分析和预测等数字化管理系统。由于顾客让渡价值=总顾客价值—总顾客成本。而除了价格成本之外,寻找和获取产品和服务所花时间、精力是重要的顾客成本。因此降低顾客得到服务的困难,是提高顾客交付价值的重要手段。通过种种手段提高销售人员的效率,加快销售过程,使客户获得及时服务,减少顾客等待时间,可以大大改善客户关系。

(三)数据挖掘有利于新产品开发

由于广泛收集、保存了客户信息,通过对客户需求分析、市场细分和销售预测,可以辅助新产品开发。在新产品开发中,可以将客户对颜色、款式、规格、大小等的喜好考虑进去。提供完全满足客户需要的产品,能获得顾客满意,提高顾客忠诚度,加强客户关系。

(三)数据挖掘有利于优化营销组合基于数据挖掘的营销,常常可以向消费者开展与其以前的消费行为相关的营销组合。

卡夫(Kraft)食品公司就是一个典型的例子。它建立了一个拥有30OO万客户资料的数据库。数据挖掘是通过收集对公司发出的优惠券等一系列促销手段作出积极反应的客户和销售记录而建立起来的。卡夫公司通过数据挖掘了解特定客户的兴趣和口味,并以此为基础向他们发送特定产品的优惠券,并为他们推荐符合客户口味和健康状况的卡夫产品食谱。

再如,读者文摘(Reader,SDige St)出版公司运行着一个积累了40年的业务数据库,其中容纳着遍布全球的一亿多个订户的资料,数据库每天24小时连续运行,保证数据不断得到实时的更新,正是基于对客户资料数据库进行数据挖掘的优势,使读者文摘出版公司能够从通俗杂志扩展到专业杂志、书刊和声像制品的出版和发行业务,极大地扩展了自己的业务。

四、数据挖掘计划

(一)基本过程

在数据挖掘过程中,数据的质量决定了能否获得有意义的分析结果。数据准备阶段大约占了数据挖掘整个工作量的80%。数据准备包括:剔除冗余数据,保证数据的逻辑一致性等。下面我们简要介绍一下数据挖掘的基本过程:第一步、确定业务目标:我们首先要清楚地确定业务遇到的问题及挑战。

第二步、准备数据:确定要挖掘的数据,并处理数据(解决遗漏的数据)。

第三步、选择合适的数据挖掘技术:例如基于数据特性、业务特点来选择分簇算法。

第四步、解释及评价结果:用可视化的工具呈现数据,目的是为了分辨出各个分组中各种属性的重要程度,并比较这组人群同所有样本中各种属性分布的不同。

在一个数据挖掘的过程中,有时需要重复以上的某些步骤。

(二)数据挖掘操作与技术

数据挖掘的主要操作包括:预测模型、数据库分簇、关联分析和偏差监测。当我们做预测模型时,实现分类操作的方法有Tree Inducti On和Neura1Inducti On两种。Tree Inducti On是指用构建决策树来预测新的情况,而Neura1Inducti On是指训练出神经网络结构来识别各种模式。数据库分簇操作可以用Dem Ographic C1u Stering来实现。关联分析操作采用简单的计算技术来发现关联规则和顺序模型。偏差监测依赖于统计分析和Vi Sua1i Zati On,后者是发现数据模式的强有力工具之一。