(三)BP神经网络方法
BP(Back Propagation)神经网络,即基于误差反向传播算法的人工神经网络,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
在使用BP神经网络方法之前,需要对模型的设定加以说明,这里由于仅仅是使用税收月度数据来实现预测,因此选择时间趋势项、税收收入前期值作为输入元,实际的月度税收收入为输出元。隐含层层数设定为4,终止误差设定为1×10-6。在运算中,我们发现随着隐含层层数的增加和终止误差设定值的降低,会提高预测的精度,但是增加的隐含层过多、终止误差设定过低是没有意义的,预测精度不会改变。这里我们选择加入时间趋势项、不加入时间趋势项,选择前1期、前2期和前3期税收收入分别作为输入元,来比较不同的模型预测精度,并且预留出2009年1-4月的实际税收收入数据来验证模型的精度。经过计算,模型的最终形态确定为输入元为时间趋势项和前一期税收收入,输出元为实际税收收入,因为其他形态的模型不能显着提高预测精度。计算软件是R2.9.0。
(四)支持向量机方法
支持向量机(SVM)是数据挖掘中的一个新方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。建立方向合适的分隔超平面,使两个与之平行的超平面间的距离最大化。其假定为,平行超平面间的距离或差距越大,分类器的总误差越小。支持向量机与神经网络类似,都是学习型的机制,与神经网络不同的是,SVM使用的是数学方法和优化技术,而支持向量机的关键在于核函数。低维空间向量集通常难以划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题。也就是说,只要选用适当的核函数,就可以得到高维空间的分类函数。
反复比较模型的预测精度后,支持向量机模型自变量设置为时间趋势项和前一期税收收入,因变量为月度实际税收收入,模型的cost值设置为40000,ε值设置为0.001,即使将cost值设置再增加100倍,ε值设置再降低10倍,依然不改变预测精度。计算软件是R2.9.0。
三、简短的小结
在对东部A省地税月度收入,分别使用多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法、BP神经网络方法和支持向量机方法建立模型并进行预测后,我们发现,在对月度数据进行预测时,多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法效果比较接近而且预测精度较高,BP神经网络方法和支持向量机方法效果比较接近,但是预测精度很低。因此,在使用月度税收收入进行预测时,选择多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法是比较合适的选择。如果具备比较详细的月度经济指标数据,同样可以尝试BP神经网络方法和支持向量机方法。数据条件不具备,例如仅仅使用月度税收数据,那么BP神经网络方法和支持向量机方法不是最佳的选择。
这里使用多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法预测东部A省地税2009年5月税收收入合计数为分别为126.53亿元,134.51亿元,两者相差8亿元左右。
文章中无论使用多参数有季节趋势指数平滑方法还是季节调整的ARIMA方法都有同一现象,即预测的结果无一例外地偏高。这也说明这两种方法的局限,这两种方法说到底是用税收过去时期的数据通过加权平均的方法对未来值进行推测,如果过去经济发展比较稳定,那么税收数据也会表现稳定,预测结果应该不会出现一致偏高的结果。但是,如果过去经济发展不稳定,例如2008年的金融风暴,那么经济的迅速下滑会很快反映到税收数据中,但是过去的税收数据不能充分包含这一信息,因此预测会出现偏高。克服这一现象的方法是使得数据包含的时期尽可能为一个完整的经济周期,通常需要10年的数据。更为重要的是,无论使用哪种方法实现预测,都需要根据当时的经济环境和自己的预测经验修正预测结果。
主要参考文献
1.张伦俊,王家新.中国税收收入的季度模型分析.财贸经济,2007(11).
2.郭菊娥,钱鑫,曹华.2004年中国税收收入预测研究.财经科学,2007(S1).
3.顾海兵,周智高.“十一五”规划期间我国税收收入水平预测.财政研究,2005(1).
4.王道树,曾智慧.荷兰税收收入预测工作与启示.中国税务,2008(3).
5.易丹辉.数据分析与EViews 应用.北京:中国人民大学出版社,2008.
6.薛毅,陈立萍.统计建模与R软件.北京:清华大学出版社,2006.
Comparison Study on Measures of Forecasting Monthly Revenue in China
Abstract:This paper constructed the monthly revenue forecasting models byusing the measures of Holter‐Winter,seasonal adjusted ARIMA,BP neuralnetwork,and SVM,based on the data from one province in eastern China. Bycomparison of prediction of diffident models,we found that prediction by using themeasures of Holter‐Winter and seasonal adjusted ARIMA were superior to that byusing the measures of BP neural network and SVM.
Key Words:Forecasting;Monthly revenue;Comparison study