书城管理客户关系管理理论与实务
7384800000017

第17章 CRM中的数据分析与应用(2)

1.关联分析

关联分析(Association Analysis)就是从大量的数据中发现项集之间的关联、相关关系或因果结构以及项集的频繁模式。

关联分析发现关联规则,关联规则是数据挖掘的核心技术。

关联规则就是给定一组项目和一个记录集合,通过分析记录集合,推导出项目间的相关性,关联规则广泛地应用于商业界、医疗保险、金融业、司法部门等,因此,对它的研究有着极其重要的意义。

在关联规则系统中,规则本身是“如果条件怎么怎么样,那么结果或情况就怎么样”的简单形式。关联规则可表示为A B。左部A称为前件,右部B称为后件。前件可以包括一个或多个条件,在某个给定的正确率中,要使后件为真,前件中的所有条件必须同时为真。后件一般只包含一种情况,而不是多种情况。

以置信度(也称正确率)为目标的关联规则,主要是以置信度表示前件为真时,后件为真的可能性。对于“A B”关联规则,其置信度可定义为:

对用户来说,最重要的是规则的置信度。置信度达到80%以上的规则,表明发现的关系是很强的。即使它们对数据库的覆盖率较低,出现的次数不多。

以支持度(也称覆盖率)为目标的关联规则表示数据库中适用于规则的记录数量。支持度高表示规则经常被使用。可定义为:

一个超级市场的销售系统记录了客户购买货物的详细情况。下面以一个简单的客户购物清单加以分析。

超市经理想知道商品之间的关联,要求列出那些同时购买的、且支持度0.4(即在5行中至少出现两次)的商品名称。知识发现数据库系统通过特定算法(如著名的Apriori(验证)算法及或改进型算法)多次扫描数据库,依次得出结果。其中支持度<0.4的项目,如单项中的(面包)、(雨伞)和双项中的(尿布,牛奶)等已经略去,3项统计为空,其中只有(啤酒,尿布,牛奶)出现了一次,支持度小于0.4则略去。

Apriori算法和DHP算法得出的知识可解释如下(在DB Miner软件中,由系统自动解释):从单项统计中,看出80%的客户买了啤酒,80%的客户买了尿布。从双项统计中看出,60%的客户同时买了啤酒和尿布,40%的客户买了啤酒和牛奶,40%的客户买了尿布和爽身粉。还可观察到买了啤酒的客户中,又买了尿布的占0.6{啤酒,尿布}/0.8{啤酒}=0.75(称为信赖度)。

于是,可得出下列6条规则,其中S为支持度,C为置信度。

R1:啤酒~尿布,S=0.6,C=0.6/0.8==0.75

R2:尿布~啤酒,S=0.6,C=0.6/0.8==0.75

R3:牛奶~啤酒,S=0.4C=0.4/0.4==1

R4:啤酒~牛奶,S=0.4C==0.4/0.8=0.5

R5:尿布~爽身粉,S=0.4C=0.4/0.8=0.5

R6:婴儿爽身粉~尿布,S==0.4,C=0.4/0.4=l

知识发现(Knowledge Discovery in Databases——KDD)规则反映了商品之间的表面关系,但不一定是现实间的因果关系。例如,R6:“尿布~爽身粉”有很高的置信度,是相当合理并且可以解释的;R3有很高的置信度,将提示进一步的调查分析,而在本例中,是因为数据太少而引起的失真所致。

2.序列模式分析

序列模式分析和关联分析法相似,其目的也是为了挖掘出数据间的联系,但是序列模式分析的侧重点在于分析数据间的前后(因果)关系,发现诸如“在购买A商品后,一段时间里客户会接着购买商品B,而后购买商品C”的知识,形成一个客户行为的“A-B-C”模式。可以想见的是,一个客户在买了手机之后,就很有可能购买手机套、手机挂件等配件。

以一个零售商的例子说明,如果数据挖掘系统在分析时按客户号而不是按交易号分组,并进一步将每组按时间分类。

本例中,最小置信度是0.5,最小支持度是0.5。规则是“先购买了商品X的客户后购买商品Y”的置信度为C,支持度为S,则:

以组(同一客户)为准,并且在Item1和Item2之间保持时间顺序关系,则可以得出一个简单的序列规则。中的第一行表示客户在购买了商品A之后,必定随着购买商品B,其置信度C为1,支持度S为0.5。

运用序列模式分析这些记录,零售商则可以发现客户潜在的购物模式,例如,客户在狗仔微波炉前最常购买何种商品。保险公司利用序列模式分析法可以预测用户投保后最常采用的医疗措施,从而识别可能的欺诈行为。

3.分类分析

分类分析就是通过分析样本客户数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他客户的记录进行分类。

决策树是一个典型的分类算法。决策树中的每个叶节点表示一个类别标志,每个非叶节点表示一个用于分类的属性。

是一个可用于客户购买电脑倾向的数据集,客户的年龄、收入、是否有学生及信用情况被收集其中。

我们首先把年龄属性以30岁和50岁为标准分为三种类型:30岁以下为年轻型,年龄大于等于30岁小于50岁为中年型,大于等于50岁为老年型;收入属性以1 000元和2 000元为标准分为三种类型:高收入2 000元以上,中等收入大于等于1 000元小于等于2 000元,低收入1 000元以下。

在这个例子中,应用决策树算法预测客户的购买倾向。先根据年龄情况进行划分,其中,中年人肯定会购买电脑,但对于年轻和老年的情况仍然需要再分,分别根据家中是否有学生和信用水平得到另外的分支。当然这只是一个理想状况下的范例,但它演示了决策树如何利用已知的属性进行购买倾向的评估。当一个实用问题的规模发展到一定地步,用人力去寻找判断好坏的标准将非常困难。然而,分类分析可以判断成百的属性、计数百万的记录,以建立描述规则的决策树。

4.聚类分析

这是分类的逆向方法。聚类把没有分类的记录,在不知道应分成几类的情况下,按照数据内在的差异性大小,合理地划分成几类,并确定每个记录的所属类别,然后,再对每类进行深入分析。它采用的分类规则是按统计学的聚类分析方法决定的。

5.孤立点分析

孤立点又叫噪声,是数据库中与数据的一般模式不一致的数据对象。孤立点的存在有很多原因,比如收集数据的设备出现故障、人为输入时的输入错误、数据传输中的错误等,但数据挖掘前会对数据进行清理、转换,解决数据的错误和不一致,所以孤立点更多时候表现的是一种特殊的、与众不同的对象或模式。这时孤立点的信息就显得十分重要。如果一味地在算法将孤立点去掉或忽略,则有可能失去重要的信息。孤立点分析就是专门挖掘这些特殊信息的方法。

孤立点分析主要包括了基于统计的孤立点检测、基于距离的孤立点检测等多种方法。基于统计的孤立点检测是运用统计学知识进行假设检验找到孤立点的方法。但数据的分布函数并不总是已知的或可以假设的。而且统计的方法只能用于一个属性,对于多维数据的孤立点分析就不合适了。

基于距离的孤立点检测是找到在周围的一定范围内没有足够多的点的对象。首先要给定对象数目和邻域半径,然后搜索每个点,如果存在一点,在给定半径的邻域内没有足够多的点(也就是点的数目小于给定的对象数目),则称这一点为孤立点。

孤立点检测的目的是找到特殊的点,进而发现特殊的行为模式,因此,被广泛应用于信用卡诈骗、电话盗用等诈骗活动的发现。

6.4.3 CRM中数据挖掘模型的建立过程

启动一个数据挖掘项目很容易,但要完成它却很困难。容易启动的理由是数据挖掘项目要解决的往往是一些对于企业来说很重要,同时也很难解决的问题,建立这样的模型是企业急需的。但数据挖掘本身的复杂性,再加上需要消耗大量的人力和财力,因此,数据挖掘模型的成功建立需要花费相当的心血,依照规范的过程进行操作。

是数据挖掘模型的建立过程图,基本上由7个步骤组成,下面对每一步骤分别说明。

步骤1:确定分析和预测目标

在建立数据挖掘模型之前,首先要明确企业的业务目标,即想通过数据挖掘模型解决什么样的问题,达到什么目的。比如,企业想进行一次对现有客户的连带销售电话的直销活动,可是不知道该选择什么样的客户作为目标客户,这种情况下,主要问题可能是“现在客户中谁最有可能正面反馈这次针对产品A的电话直销活动?”数据挖掘虽然不完全肯定里面有无企业要找的准确答案,但至少可以帮助理清思维,校正原先可能的误解,这就是数据挖掘的功效。

明确了要解决的问题之后,目标确定并没有结束,必须将要解决的问题转化为可以测量的目标,即数据挖掘的成功准则。显然,必须给出一个质或量的变化才可以测量。比如,要得出客户正面反馈率比过去提高多少个百分比这样的可测量指标,否则,无法确定此次数据挖掘工作是成功还是失败。

另外,作为数据挖掘的第一个步骤,必须按照项目管理的一般方法考虑其他的因素,如可用的技术、资金、人才和时间等资源投入,确定项目期等。即必须有一个明确的计划,以确定数据挖掘项目的总体项目框架。

步骤2:建立数据挖掘库

建立数据挖掘库是数据挖掘模型建立过程中比较复杂的环节。确定了要解决的问题以及可以测量的目标之后,必须对数据挖掘的基础数据进行收集、描述、选取等工作。比如,数据从哪里获得?数据仓库里有无直接可用的数据集市?所选用的数据表中哪些字段是必要的,如何描述这些数据等,对数据的初步了解可以帮助分析这些数据的可用性与适用性。另外,也可以用一些简单的工具随机地抽取一些记录,检验它们的质量,只有对数据建立基本的可信度之后,才能进入数据挖掘库,才可以进入下面的步骤,否则,太多的返工会产生很多不必要的资源浪费。

步骤3:数据准备

这一阶段是对已确定的能进入数据挖掘库的基本数据进行必要的转换、清理、填补以及合并工作。比如,有些数据挖掘工具只能处理数字类型。这种情况下,就必须对字段值进行必要的转化。一般数据仓库产品里都有特别的工具做这项工作,可以帮助用户从事数据准备。

数据准备工作比较烦琐,但非常重要。因为,如果数据质量不高,就会影响建立模型的准确度,数据越完整,越准确,在此基础上发掘的数据规律(Pattern)就具有更高的可信度,从而更好地实现数据挖掘的目标,否则,从“垃圾”数据里再怎么挖掘也只能是垃圾,这是毫无疑问的。

步骤4:数据相关性前期探索

在前面介绍数据挖掘技术时谈到,有些数据挖掘在定性和数据分类方面使用方便,可以作为更高一级预测的“探索”工具。比如,先用决策树或聚类方法帮助找出数据的总体趋势以及预测变量相关性之后,再用神经网络或规则导引方法有针对性的建模。一来可以细化数据,提高性能;二来在某种程度上也可以帮助消除噪声;也可以作为不同方法比较之用。

步骤5:模型构造

模型构造阶段是数据挖掘技术应用的关键阶段,有以下几个子步骤。

◆选择适用的挖掘技术

根据挖掘目标所要解决的问题,比如是历史数据描述性质的,还是对未来行为进行预测的,选择相应的挖掘技术,因为每一种挖掘技术有其适用性。

◆建立培训数据和测试数据

对基础数据必须分为两部分,一个是供模型建立的数据,另一个是供模型建立后检验其准确率的数据。两者的使用目的是不一样的。

◆利用培训数据采用相应算法建立模型

这个步骤就是采用相应的算法确定输出和输入的关系,即函数Y=P(a?x?,a?x?,a?x?,……anxn)中恒定参数an的数值,一旦确定,便称为模型已建立。

◆模型解释

模型建立以后必须对模型进行分析和解释,业务专家和数据库专家同时参与,以找出模型中的实际意义。

步骤6:模型评估和检验

这个阶段对所建立的模型用测试数据进行测试,计算误差率,以确定模型的可信度,如果不令人满意,未达到预期的误差率目标,那么,就必须重回到数据了解阶段,重复相关过程,一直找到令人满意的模型为止。当然,也有可能最终放弃导致项目失败,在这种情况下,就有必要重新审视最初的挖掘目标是否合理。

步骤7:部署和应用

如果经过测试和检验,所建立的模型可信,并在预定误差率范围内,那么,便可以按照这种模型计算输出值,并按照输出值确定决策的基本依据。这样就可以在企业范围内全面部署这个预测模型。在应用过程中,必须不断用新数据进行检验,不断测试其成功概率。经过反复试验成功的模型就成为企业的一个重要的“知识”,为企业成功决策打下良好的基础。

6.4.4 数据挖掘模型在CRM中的应用

从前几节的应用可以看出,数据挖掘技术是客户关系管理深层次应用的技术核心,几乎就是为其量身定做的。在客户关系管理的各个阶段都可用到数据挖掘技术,数据挖掘在CRM中的应用模型。在实践中,这需要在客户关系的各个阶段使用与客户相关的信息来预测与客户的相互作用。以下从数据挖掘模型在CRM中的应用入手,说明数据挖掘技术对CRM的影响。

1.营销活动响应模型

营销活动响应模型可以帮助企业提高市场活动的响应率,使营销活动做到心中有数,有的放矢。

企业为了与客户沟通,可以采取广泛的媒体广告、大量的电话行销、市中心及车站码头的广告牌等方式。这些方式有时也能取得较好的成效,但有时可能因为客户的响应率比较低,会有高额的付出,或不能取得预期的效果。而数据挖掘的响应模型可以帮助企业改变这些,企业可利用现有的客户记录和资料找出客户的一些共同的特征,由此深入了解客户,还可以通过分类或聚类分析对客户进行群分后,再由模型预测哪些人可能会对企业的营销活动产生反应,以帮助市场销售人员找到正确的行销对象。

例如,一个邮件直销商利用现有的客户邮件地址数据库给潜在客户发送用于促销的新的计算机产品宣传册和将要开始的产品降价信息。不加区分地给每名客户都发送促销宣传册显然是一种很大浪费,而有针对性地给有最大购买可能的客户发送产品广告,才是一种高效节俭的营销策略。这时可以采用分类方法中常用的决策树归纳方法对数据库中的一部分数据进行分类,得出数据集的决策树模型,如果模型的准确率经测试被认为是可以接受的,那么就可以使用这一模型建立的规则对邮件数据库进行响应预测了。

在RFM模型中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M(Monetary)表示客户在最近一段时间内购买的金额。这用来基于客户过去行为计算一个客户的价值。用特定的权重将过去交互作用(或购买)的新近情况、交互频率和交互的货币价值综合起来考虑分析。这种综合评价可以用来预测客户对一个营销活动参与的可能性。

2.客户价值评估模型

企业的利润与客户价值息息相关,其实客户关系管理的核心也就在于提高客户盈利能力、提高客户价值。它和客户忠诚度正向相关,是数据挖掘的基础。

数据挖掘技术可以用来预测不同的市场活动下客户价值的变化。通过相应的预测模型,来预测客户的未来行为,不断调整客户关系维护的策略,从而赢得高价值客户的忠诚,把高价值客户留住(黄金客户),从而最大化高价值客户的终身价值。对于一家典型的商业银行来说,最为重要的20%的客户能带来总收入的140%到150%的收益,而其中50%的收益被银行另外20%的最差客户从银行利润中吞噬掉了。这一结果也说明了庞大的市场份额并不一定总能带来高额利润。在这家银行里的管理层必须明白银行的真正利润是从哪里来的,通过数据挖掘,将营销目标定位于那些能给银行带来最多利润的优质客户。另外,客户的盈利能力也会经常发生变化,企业如果能良好预测客户预期的盈利能力趋势,将会给企业的客户关系管理能力带来良好的效用,对企业客户关系管理的应用中常把客户根据盈利能力的大小分为两类:黄金级客户价值评定比较高,青铜级客户价值评定比较低。在现实的管理过程中,经常会发现一些黄金级客户逐渐演变为青铜级客户,却不知原因出在什么地方,也不知道下阶段会有多少黄金客户会变为青铜客户。数据挖掘技术能够从客户的历史信息中预测出将来演变的趋势和概率,企业可针对性地采取措施,防止客户价值变低,鼓励有可能增加客户价值的演变。

3.交叉销售模型

商家与客户建立的商业关系是一种持续的不断发展的关系,良好的客户关系对商家利润的贡献是很大的。所以一旦建立起这种双向关系后,商家会尽量优化这种关系:延长关系的时间,关系期内增加接触,每次接触中获取更多的利润。

商家在与客户建立了商业关系之后,就可以向他们提供更多的商品或服务。在优化这种关系后,可以在巩固现有关系的基础上,增加向客户提供更多商品和服务的机会。其目标是达到双赢结果,即客户和公司都可以从中获益:客户获益是由于他们得到了更好更贴切的服务质量,商家则因为增加了销售量而获利,这就是交叉营销,它是基于老客户开展新业务的过程,或者理解为向现有的客户提供新的产品和服务的营销过程。购买了咖啡的客户会对速溶方糖这种产品感兴趣,购买了尿布的客户会对其他婴儿产品感兴趣。商家可利用这种关联对客户进行交叉营销,以增加客户的价值贡献。

以一位拥有银行卡的客户为例,他希望得到的全部金融服务都能通过这张银行卡实现,如住房按揭还贷、小额抵押贷款、股票和其他有价证券的买卖、购物消费、外汇买卖、电子汇兑和代收代付家政服务等。因此,借助于CRM,银行可以对那些优质的银行卡客户进行交叉营销,起到事半功倍的效果,从而使银行的利润得以提高。

数据挖掘在客户关系管理中的应用是从现有一定量的历史数据中开始的,最好建有丰富信息量的数据仓库,从客户的历史交易行为中寻找交叉营销的机会。从清洁数据中进行数据挖掘可以得出一些模型,筛选出有价值的模型,并且这个模型能够预测出客户将来的一些消费趋势或某种消费行为的概率。在决定选择哪些客户最有价值进行某种商品或服务的交叉营销时,模型预测出的概率就可以作为指标来排序了。

用数据挖掘技术对交叉营销做分析时应包括三个步骤。一是分析现有客户的购买行为和消费习惯数据,然后用数据挖掘的一些算法对不同的销售方式的个体行为进行建模;二是用建立的预测模型对客户将来的消费行为进行预测分析,对每一种销售方式进行评价;三是用建立的分析模型对新的客户数据进行分析,以决定向客户提供哪一种交叉销售服务最合适。通过相关分析,数据挖掘可以帮助分析出最优的合理的销售匹配。

相关分析的结果可以用在交叉销售的两个方面:一方面是对于购买频率较高的商品组合,找出那些购买了组合中大部分商品的客户,向他们推销“遗漏的”商品;另一方面是对每个客户找出比较适用的相关规律,向他们推销对应的商品系列。通过聚类分析,可以确定属于某一类的客户经常购买的商品,并向一个购买了婴儿车的客户很有可能对你们生产的婴儿尿布或其他婴儿产品感兴趣,这很容易理解。但对企业,真正关心的问题在于如何发现这其中内在的微妙关系。数据挖掘就能够帮助企业发现这其中的关系。

4.客户流失模型

客户的保持是客户关系管理的核心内容,也是考核客户关系管理系统成功与否的首要指标。行业的竞争越来越激烈,获得新客户的成本节节攀升,保持老客户也越来越有价值。

首先,在客户关系管理中可以运用数据挖掘方法来预测客户的流失趋势,并找出影响企业保持能力因素的薄弱环节。通过研究,认为数据挖掘技术中的决策树技术(DecisionTree)能够较好地应用在这一方面。决策树是在一系列决策基础上做出预测的决策模型。树的每个分支都是一个分类问题,即对某些重要问题做出预测,相似的记录会落在分支的同侧,于是,原始数据便被分割成树的叶子。从决策树中得到的预测分割同时还带有对它本身进行定义的一些特征的描述。通过各种决策树算法(如CART,CHAID等),在挖掘特定数据的基础上给出预测模型,由此按计算出的预测流失率细分客户群体,并对症下药。

其应用最广泛的是在移动电话业中,由于客户迁转成本较低,客户保持能力较差,流失现象最容易发生。例如,在中国移动和中国联通的竞争中,客户相互流出流入的量比较大,中国联通一个存话费送手机的市场活动可能会导致中国移动一定量的客户流失。具体哪些客户可能流失,数据挖掘技术可根据客户的历史消费习惯做出的一定预测。

其次,数据挖掘技术在客户保持的管理中也起到了很大作用。首先得有大量清洁的数据信息,尤其是客户一段时间内的行为信息,并初步统计一些相应的评价指标。如客户的重复购买率、客户的需求满足率、客户对竞争产品的关注程度、客户购买的挑选时间、客户对产品质量的承受能力等。在对数据初步分析的基础上再做预测模型的构建,建模时可使用决策树中的分类回归树(CART)、CHAID、C4.5、神经元网络等。产生一定的模型后,对模型的检验也需要一定的数据量,具有良好质量的模型将给客户的流失预测带来较高的准确率。有一定的预测结果后,商家可以采取相应的预防措施,最大量地减少客户流失,提高企业客户保持能力。

最后,对于关系盈利性的预测和评价是数据挖掘在客户关系管理中的一项基本应用。对于关系盈利性的评价,通常是借助客户忠诚度来衡量,只不过其分析的数据比新客户开发要多得多。数据挖掘还可以帮你发现谁该去维护,也就是帮你挖掘出最有可能离你而去的客户。首先要找出哪些客户最有可能“离我而去”,然后采用回归分析决策树或神经网络等,识别出客户流失的模型,然后,运用获得的模型对当前的客户进行评分,当客户得分大于某个临界值时,则表明该客户有潜在流失的可能性,企业应该采取积极的措施防范客户流失。

6.5 CRM的决策支持和商业智能模型

一般企业在经营过程中可能自以为很了解客户。但是,除了一些最基本的信息交流这些浅层次的工作外,需深入挖掘的东西并没有涉及。比如,公司里面的市场策划、销售和客户服务人员如果要对完全的客户档案进行访问(这些资料包括客户对特定市场功势的反应和它们的购买倾向),其困难到底有多大?对于客户的未来产品需求走势怎么预测?许多企业还没有考虑到,管理仍停留在一种浅层次业务处理上。

客户关系管理的过程,说到底就是对客户信息进行分析处理并做出决策的过程。客户关系管理软件并非普通的企业管理软件,纵观客户关系管理软件产品,可以明显地看到决策支持系统和商业智能系统是构成企业决策智囊团与加速器的重要基础。在市场瞬息万变、企业竞争越来越烈的状况下,缺少了决策支持系统与商业智能的支持,企业的决策是无法迅速反应和有效做出的,这已经成为不争的事实。

6.5.1 CRM中的决策支持系统模型

1.决策支持系统概述

决策支持系统(Decision Support System——DSS)是支持决策者利用数据和模型解决半结构化和非结构化问题的系统,对公司运作日益重要。

结构化决策涉及的变量较少,只要采用专门的公式来处理相关信息,就能够得到准确的答案。通过计算机语言来编制相应的程序,就可以在计算机上处理这些信息。结构化决策完全可以用计算机来代替。日本的有关统计数据表明,在企业管理中有44%的工作是属于常规的工作,在这些工作中有许多是具有规律性的,完全可以由计算机来代替以往的人工处理。另外,56%需要思考的工作,其中也还有一半为规律性的工作,同样也可以由计算机来完成。

在非结构化决策中,可能提供出很多正确的解决方案,但没有精确的计算公式能够计算出哪个解决方案是最优的。也没有规则和标准能够衡量哪种方案是最佳解决方案。如公司在市场活动中刚刚发展的新客户与原有的老客户相比较,哪一类客户更能给公司带来大的利润?目前公司中最大的一些客户存在的价值是什么?应该采用何种方式来改变公司的形象?诸如此类的问题,在没有决策支持系统作基础的情况下是难以迅速而有效地进行决策的。

作为客户关系管理基础的决策支持系统具有高度的灵活性和良好的交互性,适用于非结构化决策的客户关系管理系统。将决策者与决策支持系统密切联系在一起,并通过信息技术为其决策提供特定的支持功能。客户关系管理系统具有高速、大量信息和复杂处理的能力,能够帮助决策者建立决策时的信息模型,而决策者则是有着丰富经验、实践知识、直觉和判断能力,并且熟悉决策的全过程的人。客户关系管理中的决策支持系统并不能够替代决策者本身,它的主要功能是提高决策者的决策效率,帮助企业的决策者强化洞察力。企业决策者的知识、技能和IT技术的完美结合,使得决策者能够面对迅速变化的市场做出及时的响应,并有效地配置企业的各项资源。

2.客户关系管理的决策支持系统模型

大多数客户关系管理软件中的决策支持系统由三个部件组成:数据管理、模型管理和用户界面管理。数据管理:DSS中保存了客户和管理的信息,除公司的内部信息外,还包括外部信息、竞争对手信息、行业发展信息;模型管理:DSS必须要用模型对信息进行分析,利用模型产生决策所需的信息,辅助决策者做出产品生产和库存计划;用户界面管理:企业的决策者通过用户界面存取信息并制定决策者所需的分析模型。

到CRM的数据和信息基本流程及数据仓库等技术在整个流程中所起的作用。最初,运营数据(企业与客户间已发生的业务处理记录)是从客户“接触点”收集的,这些运营数据连同遗留下来的内部客户数据和外来的市场数据经过整合和变换装载到客户信息数据仓库中。之后,OLAP工具通过对客户信息的归纳、分析和处理,把DW中繁多的数据转化为有用的信息。主要是对基层的操作数据进行多维化或预综合处理,并以一种直观易懂的形式将查询结果提供给决策人员。数据挖掘工具利用DW、模型库、方法库和知识库共同完成数据挖掘过程。

数据挖掘工具触发DW管理系统,从DW中获取相关的数据进行高度自动化的分析、推理,从中挖掘出客户潜在的模式,预测客户的行为。最后利用报表工具和企业信息系统等有关客户的信息和知识在整个企业内得到有效的流通和共享。

这些信息和知识将转化为企业的战略和战术行动,用于提高在所有渠道上同客户交互的有效性和针对性,同时可以将有些知识放于知识库中,用于新的知识发现和知识评价。

模型库实现多个广义模型的组合辅助决策,知识库存储用于模拟人类决策过程中的某些智能行为的规则、模式和规律,方法库向系统提供通用的决策方法、优化方法及软件工具等。

6.5.2 CRM中的商业智能模型

CRM的最终目的是确保客户忠诚度,以使企业利润最大化。CRM的构建,在技术方面要把握的是CRM是“面向客户”的智能化企业信息系统。知识经济时代,与客户相关的数据是海量的。据统计,全球企业的信息量平均每1.5年翻一番,而目前仅仅利用了全部信息数据的7%。随着知识经济时代的来临,记录客户与市场数据的信息和信息利用能力已经成为决定企业成败的关键因素。从海量数据中快速有效地抽取有用知识,以支持面向客户的决策,是传统技术难以有效完成的,商业智能技术也就有了用武之地。

所谓商业智能(Business Intelligence——BI)就是把海量数据转化为知识,以支持企业正确决策的方法和过程。确切地说,商业智能只是一个新概念,并不是一种新技术。一般认为,数据仓库、OLAP和数据挖掘是商业智能的三大支撑组件。数据仓库构成整个商业智能的数据基础,通过对源数据的ETL(Extraction/Transformation/Load)生成。OLAP和数据挖掘则是为商业决策提供支持的知识提取和展示的智能化过程。

为帮助企业规划、执行、修正并跟踪企业市场的营销活动,IBM公司于2000年年初推出了全新商业智能软件——Decision Edge for Campaign Management(简称DECM)。DECM软件是端到端客户关系管理解决方案(CRM)中的重要部分。它不但能够对来自事务处理系统、呼叫中心、网站的客户信息进行处理,使公司的所有部门共享这些信息,而且可以通过客户选择的渠道发送信息。这样,市场经理就可以更加全面地了解客户关系状况,并有效地评价市场营销活动的结果。DECM软件可以调节DB2通用数据库的对应性和可伸缩性,使市场营销人员更好地管理不断扩大的客户数据库。与IBM公司DB2IntelligentMiner软件系列一起使用,它还可以帮助企业发现更多的销售机会。

6.5.3 决策支持和商业智能在CRM中的应用

企业庞大的数据库中存储着客户及企业营销和服务等方面的信息,倘若没有一个具有高度商业智能的数据分析和处理系统是不可想象的。CRM将最佳的商业实践与数据挖掘、数据仓库、销售自动化,并与其他信息技术紧密结合在一起,通过充分挖掘客户的商业行为个性和规律,不断寻找和拓展客户的盈利点和盈利空间。借助CRM系统积累的多维数据并结合商业智能,可以更加科学和快速地提供高效的决策分析。

1.了解客户

我们一直在强调要了解客户,其意义不仅在于了解客户的分布,更重要的是了解客户的需求特点、购买历史,了解客户与公司之间所有的交互。通过跟踪、观察和分析所有这些交互,使企业能够随时对客户的需求和想法有更好的了解。如何采取措施提高客户忠诚度,已成为企业考虑客户关系时的关键问题。客户忠诚基于客户满意度,只有在深入了解客户特征并通过分析与客户的历史交往过程的记录,即客户数据库后,才可能从中发现潜在的、与客户满意及忠诚有关的且有价值的信息。

在基于商业智能的CRM中,可以利用聚类分析技术,根据客户的个人特征以及消费数据,将客户群体进行细分,也就是通常所讲的客户分类。并且进一步对客户差异进行相应的总结性描述。客户分类和客户差异描述已经将最初的存储在客户数据仓库中的数据转化为信息并最终总结为知识。在考虑客户差异的前提下,针对不同的客户群,企业可以制订相应的营销服务方式和客户发展策略。

总之,一个企业内部的相对复杂度越高,高层管理者就越难控制其复杂的商业结构,也就越需要商业智能的支持。另外,一个企业的客户相对数目越多,企业就越难把握客户的购买模式和行为习惯,对客户信息和市场信息的片面分析很难得到对客户真正而全面的描述,因此,对商业智能技术的需求也越强烈。在基于商业智能的CRM中,商业智能可以更好地发掘知识,帮助企业保留旧客户,争取新客户,了解客户的需求和期望,从而针对不同的客户提供不同的服务。

是某商业银行对工商企业类客户的价值评价的指标。显示了客户知识发现支持系统的工作流程。

客户知识发现系统的实现将帮助商业银行挖掘与客户消费或偏好有关的规律或模式,而这些规律经过银行专家的解释,可以得出许多意想不到具有高价值的客户知识。这些客户知识可以被直接应用于已有和潜在客户的客户价值识别中,帮助建立具有个性化的营销策略,提高商业银行的工作成效性。

2.客户获得与保持

通过对客户行为进行分析,识别客户特征,找到潜在客户,获得新客户。如能回答赢得某些客户群体的最佳广告类型是什么,赢得客户的最有效广告媒体是什么,购买特定商品的是哪一类客户等这样问题的模型,就可以应用到客户获取中。

保持长久客户关系,避免客户流失,提高客户满意度是CRM的关键。实践表明,保留一个客户比争取一个客户的花费要少得多,因此,客户保持也显得越来越有价值。类似地,很多模型也能够完成客户保持的任务。比如客户流失建模,如果模型能够回答最有利可图或最无利可图的客户具有哪些特征,客户最可能的购买时机是什么时间,就可以给决策者提供信息以采取相应的措施,防止客户流失。CRM系统使用的客户保持技术多种多样,像OLAP、分类树(CAR、CHAID等)、聚类技术等是比较常见的。例如,在银行业中,用分类技术建立了一个模型,定义客户在不同的生命周期内不同的消费行为。如在早期,某一类客户可能对助学贷款和养老保险储蓄感兴趣,而在后期,对房屋贷款和投资不同行业更感兴趣。这样的模型就可以帮助银行对相同类型的客户作出营销策略。显示了这样一个模型的建立和使用过程。

3.风险评估和诈骗检查

欺诈检测、风险评估等在银行业、电信业用得比较普遍,这两个行业也是CRM系统、商业智能系统应用得比较好的行业。这两类模型很多时候是相辅相成的,风险评估的目的之一就是为了避免欺诈,欺诈检测往往是风险评估的一种手段。

可以采用分类和聚类这样的技术来区别正常用户和欺诈用户,分析它们的特征,用作欺诈检测。风险评估涉及的参数可能包括用户的经营情况、历史信贷记录、信誉度和还债能力等。商业智能技术帮助信用评估由定性转向定量,更加可靠,从而提高客户的信用决策水平。

由客户基本信息表、客户话费详单、客户欠费表等电信公司已经积累的大量数据中,经过ETL(Extraction Transformation Load——数据的抽取、清洗、转换和加载)建立起数据集市。将数据集市中的数据部分用来建模(即防欺诈模型),其他数据使用到模型后,就有两种结果:欺诈和不欺诈。对于被判断为欺诈的客户系统告警,引起大家的注意,对此类客户采取必要的措施。

案例分析:商业银行如何实施数据仓库技术管理客户

数据仓库技术对商业银行具有很重要的作用,那么商业银行应该如何实施数据仓库技术来管理好客户呢?

1.进行数据清理的工作

进行数据清理的工作,就是将现有业务系统中有关客户的账号数据,加载到中央的市场客户信息库,建立以客户为中心的数据仓库基础环境。现有银行业务系统的设计都是以账号为中心,客户与银行的往来业务不同,需要使用不同的账号。另外,银行的业务系统随着时间的演变,会增加新系统和修改旧系统,数据存放在不同的磁盘上。再者,软件可能由不同的公司设计,使用不同的数据库系统在不同的硬件平台和操作系统上运行,造成字段的名称和格式代码都不一致,数据的冗余性很高。上述这些情况,是现有生产系统无法进行以客户为中心的数据分析的主要原因。

在市场客户信息库建立完成后,银行的业务部门对客户有统一的视图,以客户为单位分析银行的业务情况,知道客户的人数、客户与银行业务往来的情况、客户的基本分类、了解客户的基本需求或其他与客户有关的复杂的查询与报表,如趋势分析、集群分析等。

2.建立分销渠道的分析和管理

将客户与银行分销渠道的所有历史交易明细数据,包括柜台、ATM、信用卡、汇款、转账等,再加载到中央的市场客户信息库。此时,银行的业务用户可以分析客户使用分销渠道的情况和分销渠道的容量,如客户类型与位置和渠道的关系、哪些地区的渠道最受什么类型的客户喜好、银行分销渠道与产品和服务的关系、分销渠道的容量和生产力比较、促销对客户和渠道的影响、时间段分析和比较等。本阶段完成后,银行已经知道客户、渠道、产品或服务三者之间的关系。了解客户的购买行为、客户和渠道对业务收入的贡献、哪些客户比较喜好经由什么渠道在何时和银行打交道,目前的分销渠道的服务能力如何,需要增加哪些分销渠道才能达到预期的服务水平。

在客户、渠道、产品或服务的业务收入弄清楚之后,需要建立所有客户的每一个账号的利润评测模型,以便了解每一位客户对银行的总利润贡献度。要建立利润评测模型,需要收入和成本的确实金额,因此,需要加载会计系统的财务数据到中央数据仓库。在收入方面有两类,主要是与贷款和存款有关的净利息收入,以及和手续费年费等有关的其他收入。在费用方面分成三部分,直接成本可以是基于活动的成本核算或分摊的方式,间接成本如银行日常运行的生产成本和风险成本如坏账准备金等。此阶段,因为牵涉到全行对收入和成本计算的共识,大概需要6个月的时间。

当利润评测模型建立完成后,银行可以依照组织、客户和产品三种维度分析利润贡献度。根据统计,银行渠道成本的高低排列是分行最贵、呼叫中心席位次之、ATM、互联网、电话语言服务最低。银行可以依客户的利润贡献度,安排合适的分销渠道提供服务和销售,知道哪些有利润的客户需要留住,采用什么方法留住客户,交叉销售改善客户的利润贡献度,哪些客户应该争取,完成本阶段已经达成80%个性化服务的水平。另外,银行可以模拟和预测新产品对银行的利润贡献度,新政策对银行将产生什么样的财务影响及客户流失与否对银行的整体利润影响。

3.客户关系优化

接下来就是银行在什么时间主动地与客户建立更好的关系,俗称客户关系优化。客户在每一次交易中都主动告诉银行需要什么产品或服务,例如定存是希望退休养老使用、申请信用卡需要现金消费、询问放款利息、需要住房贷款等,这些都是银行提供产品或服务最好的时机。

依照国外银行的经验,客户行为的改变都是增加客户满意和银行收入的最佳时机,这些行为包括生活的改变如结婚、生小孩、搬家或继承遗产;职业的变动如工作单位、晋升、降职、离职、调职;财政和社会保障如退休金制度、所得税规定;经济因素如利息、景气循环、通货紧缩或膨胀;产品条款的改变如年费、手续费,账号变化如余额增加或减少、开关账号、定存到期,交易次数或金额的变化,信用透支等。

银行如果在24小时到48小时内没有采取行动,就失去了宝贵的商机。银行需要将账号每天发生的交易明细,以实时或定时方式加载到中央数据仓库系统,核对客户行为的变化。当有上述变化时,马上生成事件。然后,银行业务部门利用客户购买倾向模型、渠道喜好模型、利润贡献度模型、信用和风险评分模型等,主动对客户沟通并进行交叉销售,达成留住客户和增加利润的目标。完成本阶段工作,大概也需要6个月的时间。

4.风险评估和管理

风险评估和管理是实施数据仓库最困难的工作。本阶段,因为牵涉更多管理制度和系统的建立,所以需要较长的时间,主要利用各种数学模型进行分析,模拟风险和利润间的关系。银行主要业务是对资产和负债经营风险管理(经营成本),增加股东的价值。负债包括自有资本、存款和短期借入款,资产包括票据、放款、证券和承兑4种。与资产和负债有关的风险,依外部环境因素、内部因素和业务范围因素,可以有数十种之多,但最基本的风险衡量是有利率风险和信用风险两种。

与资产和负债有关的业务系统的交易数据要加载到中央数据仓库。然后,依照不同的期间,以数学模型分析、模拟、计算利率敏感性资产和负债之间的缺口,知道银行在不同期间资本比率、资产负债结构、资金情况和净利息收入的变化。在计算风险收益时,可以使用信孚银行的风险调节资本收益方法,或JP摩根的风险和信用矩阵等,计算信贷、放款客户对银行的风险和收益以估计银行的损失和利润。当本阶段完成后,则银行已经完全实现以客户为中心的个性化服务数据仓库决策支持系统,可以在满足高利润低风险客户需求的前提下,达成银行收益的极大化。

案例思考题

1.客户信息库建立完成之后,银行应该如何对客户进行分类管理?

2.如何利用数据仓库完成客户关系优化工作?

3.如何对客户进行风险评估,这对银行有何借鉴作用?

本章小结

数据是企业做好客户关系管理的重要基础,不仅业务的操作建立在数据的基础上,对业务的预测和关联分析等知识均来源于对数据的管理。企业通过内部途径和外部途径获得了大量的客户数据,不仅要提高所搜集数据的质量,还要关注客户数据的隐私保护。

客户数据存储在数据库中,因此,要加强对数据库的管理,CRM数据库的构建要符合一定的原则,同时要注意对数据库的更新和保养,以确保数据质量。

数据仓库是更高层次的数据应用,数据仓库技术的应用为数据挖掘准备了一个规范的数据源,数据仓库和数据挖掘技术可以帮助企业从这些信息中获得有价值的知识,为企业高层决策者提供准确的客户分类、忠诚度、盈利能力等有用的信息,指导企业制定最优的营销策略,降低成本,加速企业发展,并由此建立真正有客户需求出发的客户关系管理。

在市场瞬息万变、企业竞争越来越烈的状况下,决策支持系统与商业智能的支持,可以帮助企业快速反应,加快知识的获取速度,更好地满足管理层和决策层的要求。

复习思考题

1.企业可以从何处获得客户数据?

2.可采用哪些方式保护客户的隐私问题。

3.试说明数据仓库的应用效应可以从哪几方面评估。

4.数据库的构建原则有哪些?

5.数据挖掘的基本步骤有哪些?

6.试论述数据挖掘对CRM的影响。