第15章个人信用评分模型的构建

书签收藏评论目录封面

前两节中讲到的客户风险评估和项目风险评价的主要对象是商业银行已经或可能为之提供信贷服务的企业法人和其他类型的客户。但是对于个人信贷风险的评估，没有给出具体的指标体系。本节介绍信用评分模型的构建过程，并通过商业银行信用卡申请信用评分标准和住房贷款申请标准为例，介绍信用评分的指标体系。

所谓信用评分，是预测贷款申请人或现有借款人违约可能性的一种统计方法。它是指金融或专业评定机构根据客户的信用历史资料，利用一定的信用评分模型，得到不同等级的信用分数。根据客户的信用分数，授信者可以分析客户按时还款的可能性。据此，授信者可以决定是否准予授信以及授信的额度和利率。虽然授信者通过分析客户的信用历史资料，同样可以得到这样的分析结果，但利用信用评分却可以更加快速、更加客观、更具有一致性。

信用评分模型作为信用风险管理的基础和核心，无论是对于建立社会征信体系，还是对于金融机构的信贷资产管理，都有着不可替代的作用。其主要目的，在于尽量将能够预测借款人未来行为的指标加以整合，并统一成可以比较的单一指标，以显示借款人在未来特定时间内违约的可能性，所有的信用评分模型，无论采用什么理论或方法，其最终目的都是将贷款申请者的信用级别进行分类。

一、个人信用评分模型的构建过程

（一）模型方法的选择

在建立个人信用评分模型时，预测精度无疑是最为重要的，因为在许多情况下，即使预测的准确性只提高一点，也有可能使信贷机构的损失减小很多。但是在选择一种模型方法时，却并不能只单纯考虑这种方法的精确性。

在对个人信用评分模型进行评价时，一般应考虑以下三个方面：模型的预测精度；模型的稳健性；模型的可解释性。毋庸置疑，模型的预测精度是建模人员首先要考虑的问题，但是对于个人信贷消费市场处于启动阶段并且亟须发展的中国而言，模型的稳健性可能更加重要。随着市场的快速发展，当模型投入使用时，新的信用产品申请人总体可能很快就与建模总体存在差异，这时一个稳健性较强的模型的预测能力反而更好。因此，很多学者就致力于在现有几种模型的基础上，寻求兼具预测精度和稳健性的模型。

1999年，Overstreet等考察了一组汽车贷款样本的组合评分问题，他们利用这组样本的申请信息建立了一个评分模型（设用此模型对客户的评分为s1），并从信用局取得了这些客户的信用局评分（s2），然后构造了一个组合评分sc=a0 a1s1 a2s2.他们的研究结果表明，即使s2被s1随机占优（stochasticdominance），组合评分sc也有可能优于s1.也就是说，如果组合系数设置得好，组合模型的评分就有可能优于单个模型的评分。

2002年，TianShyugLee、ChihChouChiu、ChrJieLu和I-FeiChen提出了一种“两阶段混合神经网络判别方法”（two-stagehybridneuraldiscriminanttechnique），其做法是：先利用线性判别分析方法挑选对区分“好”、“坏”客户有显著影响的特征变量，建立评分模型，将这些显著性特征变量作为神经网络模型的输入单元，并将判别分析所得到的对各样本的评分也作为输入单元之一，然后建立神经网络模型。他们认为，这样的模型克服了单纯使用神经网络模型的一些缺陷，如：可以挑选出有显著意义的特征变量，从而简化了模型的结构；可以更好地给出神经网络的初始解从而缩短神经网络的训练时间；可以提高预测的精度等。

（二）数据的处理

数据处理首先需要收集数据，数据的收集涉及时间跨度、类别判定、残缺值的填补、数据的可置信度、是否为原始数据以及原始数据是否需要加工处理等各种情况，可根据自身情况加以选择；数据收集完成后，还要进行数据的筛选。数据有时可以是不同研究人员在不同情况下、根据自己现有资料搜集的，因此有可能存在数据差异的情况，这就需要对数据进行筛选清理。对于相似或者重复的记录，需要监测并且合并这些记录；对于不一致的格式，合并整理使格式一致。通过数据的筛选，可以使数据保持完整、正确和一致，提高信用评分的正确度和效率。

（三）模型的估计和验证

这一步成功的关键很大程度上取决于模型方法设定的正确以及数据收集处理的完善。目前在信贷机构中应用最为广泛的Logistic回归模型，在已知模型解释变量的基础上，应用收集的样本数据对所选择的模型进行参数估计，获得各个解释变量的权重系数。

模型的验证可分为定性和定量两个部分，其中，定性验证主要对模型的解释变量及其权重在经济意义等方面的合理性进行评估；而定量验证则通过使用ROC曲线、CAP曲线及其度量指标线下面积AUC、准确率比率AR等，来对信用评分模型的违约区分能力进行统计检验。

（四）评估和监控

前述工作已经完成，进而应该利用设定模型对数据进行评估，评出的结果可以分值或级别形式展现，作为评定信用好坏程度的标准和参考。

在量化信用评分模型的使用过程中，应该不断地对模型的评估绩效进行持续监控，以分析模型是否需要进行调整和优化。例如，在银行客户群发生变化的情况下，我们就应该对所建立的模型进行适当调整。此外，由于所建立的信用批准模型一般是预测贷款批准后10～15个月的违约表现，因此可以将实际情况与预测情况进行对比，计算实际的违约率。通常在国外先进银行中，它们会批准一些信用评分低于最佳截止点的客户得到贷款，以检验在10～15个月内这些客户是否会如预测的那样发生违约。对信用评级量化模型的监控和维护是非常重要的，因为它直接关系到前台营销和后台审批工作，通常每12～18个月会调整一次。

二、个人信用评分模型构建中指标体系的确立

评估指标体系应准确地反映评估对象的特点和实际水平，做到既全面、系统，又有科学性。国际上传统的信用评估要素有“5C”、“5P”以及“LAPP”三种形式，其中“5C”是指Character、Capital、Capacity、Condition和Collateral；“5P”是指Personal、Purpose、Payment、Protection和Perspective；“LAPP”是指Liquidity、Activity、Profitability和Potentiality。

作为个人信用评估事实上的标准，FICO评分系统在美国得到广泛使用。该模型利用高达100万的大样本数据首先将客户的5C指标具体化，再把各个指标分成若干个档次以及各个档次的得分，然后加权得出最终总分，打分范围为325～900分，分数越高，说明客户的信用风险越小，然后进行分段定级，不同的机构有不同的分段定级标准。FICO评分系统有五类主要影响因素：客户的信用偿还历史（Payment history）、信用账户数（Amountowed）、使用信用的年限（Lengthofcredithistory）、新开立的信用账户（Newcredit）、正在使用的信用类型（Typesofcreditused）。这五类因素有不同的权重，每类因素中又包括若干子项。

总结国外部分学者所用的指标体系，可以归纳出他们主要考虑的指标包括：年龄、性别、婚否、工作性质、工作行业、工作稳定性、工作时间、在居住地时间、房屋、保险、收入及其变化、应征税资产、拥有的其他资产、银行账户、信用报告被查询的次数、已有无抵押贷款数额和个数、贷款数额、是否有担保、信用时间长度、是否有其他贷款、是否有存款账户等。国外学术研究中所使用的指标体系大致经历了一个从简单到复杂的过程，这与发达国家在这个时间过程中逐渐完善的信用体系是不可分割的。

总结国内部分银行所使用的指标，可以看出，年龄、教育程度、户籍、住宅性质、单位类型、职位、在本岗位工作时间、年收入这几个变量已得到国内银行的普遍认可，与国外的指标体系相比，国内银行更关注借款者的教育程度、工作单位性质和职务等。

下面以商业银行信用卡申请信用评分标准和住房贷款申请标准为例，介绍指标体系的构成。

（一）信用卡申请评分标准——评分卡模型

在信用卡申请中，银行一般会综合考虑客户的经济条件以及信用记录，并予以打分，根据信用卡模型，将分数加总得到客户的最终得分，以该得分作为最终是否予以办卡的依据。

该表将客户的基本情况分为四大类：保障支持、经济支持、个人稳定情况以及个人背景，进而对四项总指标加以细化，分成若干项，每一项都有几个属性值，并根据客户的实际情况予以打分，进而根据专家给出的权重算出最后综合得分。由这一框架所确定的完整备选变量集合也可以为银行有针对性地收集和存储个人信贷数据信息提供有益的指导和帮助。

个人信贷业务分为多种，不同业务所需考察的指标有很多相同之处，例如无论是住房贷款，还是信用卡申请，银行都会将月收入、职业、学历、婚姻状况、以往的信用情况等作为考察指标。但是不同的业务其指标差异也很大，例如，在考虑申请住房贷款的客户时，需要考察的特殊因素有购房的首付比例、房产状态、建筑类型、购房用途等；在考虑助学贷款申请时，银行会考虑学生所学专业、所在学校就业情况等。

（二）住房贷款申请信用评分——基于Logistic回归模型上海财经大学金融学院的刘莉亚教授从借款人、贷款方案、贷款投向和风险缓释四个要素出发，构建了一套产品水平的信用评分模型的整体分析框架，该框架具体应用于个人住房贷款产品。

刘教授将指标分为两大类，包括借款人和债务，其中债务又具体分为贷款方案、贷款投向和风险缓释三方面，进而又对这四项要素进一步细化，并从中延伸出多个具体指标。

最右侧的每个具体指标都有其范围，根据不同范围给予不同分数，最后可以按照评分卡模型加权计算出其综合得分。

以上介绍了信用评分模型构建中指标体系的确立的两个具体例子，农村信用社在对个人信用风险进行评估时，也可以从中进行借鉴。

第15章 个人信用评分模型的构建

第15章个人信用评分模型的构建