7-2-1 样本数据的选取
样本数据的选取和质量将直接影响模型的最终输出,根据第6章构建的预警指标体系,进行了相关数据的采集。
由于模型数据属于时间序列数据,在时间区间的选择上,指标数据的采集遵循了以下规则:第一,在样本区间遵循的经济规律相同;第二,样本数据之间的可比性,包括价格的可比性和统计范围的可比性。由于我国在1993年底进行了一次较大的金融体制改革,导致1994年前后的数据在统计口径、指标含义上可能会有差异。因此,本书选取了1995~2006年的数据为样本,其中包含了1997年亚洲金融危机时期我国的金融数据,因此,在预测我国金融安全运行状况时更具有研究价值。样本数据选取四个金融子系统中具有典型代表的指标进行数据收集,其中以1995~2007年中国金融统计年鉴和中国经济年鉴为主要数据来源。为了建模和检验的需要,我们把12年的样本数据分为两个子样本集:训练样本集和测试样本集。训练样本中包括1995~2004年样本;测试样本则由2005年样本数据构成。
7-2-2 指标数据标准化处理
对于各类指标值,指标体系中各指标均有不同的量纲,给预警带来许多困难。所以在运用遗传BP神经网络模型前,首先对数据进行归一化处理,将数据转化为闭区间[-1,1]上的无量纲性指标值。这不但去掉了不同指标的量纲的影响,同时更重要的是使BP神经网络有更好的训练效果。
本研究采用的归一化方法是:每一指标值减去该指标的最大值,然后除以该指标的最大值。即
式中,i为第i项指标;j为第j年度;Xij为第i项指标第j年度的原始数据;Yij为第i项指标第j年度归一化后的数据。在MATLAB中调用premnmx函数即可完成对数据的归一化操作。
7-2-3 权重的确定
预警系统个别指标值超过其临界值并不表明一定会发生金融危机,因此只有将指标进行合成,联合运用才具有较高的预警价值。为了有效和科学地联合运用指标,在此对指标体系进行赋权。本研究以SPSS软件为应用平台,用主成分分析法对所获数据进行分析,在四个金融安全子系统中分别获取主成分,最终确定各金融安全预警指标权重,然后根据所获数据分析出的结果对各指标预测值进一步分析,达到预警的目的。
7-2-4 网络节点选择
由于本书构建的预警指标体系选取了涉及四个子系统的31个指标值,因此网络的输入、输出节点数均为31.而隐含层节点个数的设置目前尚没有完全科学的定论,需要依据经验公式给定的范围,通过多次的实验对比,选取模型最优情况下的节点个数。一般认为,隐含层节点数的选择与输入、输出节点多少有关系,可参考的经验公式有其中l,m,n分别为隐含层、输入层和输出层节点个数,a为常数,可随机选1~10之间的常数。