潘雷驰
摘要:文章对我国东部某省地税税收收入分别使用多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法、BP神经网络方法和支持向量机方法建立月度税收收入预测模型。通过预测精度的比较,我们发现,在利用月度税收收入时间序列进行预测时,多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法预测精度接近并且优于BP神经网络方法和支持向量机方法。
关键词:月度;税收收入;预测
在税收收入预测中月度预测一直是各级税务部门预测工作的难点,因为月度税收数据通常有比较剧烈的波动并存在明显的时间趋势,仿佛是股指图。在对月度税收收入预测中,根据影响税收收入变化的经济因素建立回归方程的方法通常不可取,因为提前获知月度经济数据无法实现。因此利用税收数据自身进行税收收入预测是可行办法。这些方法包括:传统的时间序列预测方法,例如季节模型和指数平滑方法;统计方法,例如对时间项或者自回归项进行回归和ARIMA方法;机器学习方法,例如:BP神经网络和支持向量机方法。在使用季节模型的时候,需要将月度的时间序列数据中包含的季节因子、循环变动因子和不规则变动因子加以剔除,获得时间序列数据的长期趋势,根据长期趋势曲线的形态对时间项回归,然后综合季节因子、循环变动因子和不规则变动因子的影响获得预测值,如果长期趋势线复杂,月度数据波动过大,预测的效果不理想。对时间项和自回归项建立回归方程的方法比较适合月度数据虽有波动但波动不大的预测,单纯依赖时间项和自回归项很难拟合出呈现“锯齿状”波动的月度收入曲线。因此,实际中比较可行的方法是多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法、BP神经网络方法和支持向量机方法。
张伦俊、王家新(2007)使用自回归移动平均模型、含季节调整的自回归移动平均模型、剔除季节因子的季节模型和我国1985-2006年季度税收收入数据,建立季度税收收入预测模型,经过比较发现含季节调整的自回归移动平均模型效果较好。郭菊娥等(2007)利用结构方程模型找出影响税收收入变化的因素,然后利用税收收入与影响因素的关系建立回归模型,对我国2004年税收收入进行预测。顾海兵、周智高(2005)使用回归模型,以国内生产总值、财政支出等因素为自变量,对我国“十一五”期间的年平均税收收入进行了估计。王道树、曾智慧(2008)对荷兰税收收入预测的机构、方法进行介绍,指出荷兰分税种预测、准确量化税基的方法值得借鉴。国外对税收收入的预测在过去倾向于建立几十到数百个不等的方程,对税收与经济活动进行模拟,然后实现预测。但是由于经济的复杂性导致预测精度不稳定,这一方法逐渐被微型模型替代。我国对月度税收收入预测方法讨论的文献比较缺乏,当然这有可能是受到数据来源的限制。
因此有必要对多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法、BP神经网络方法和支持向量机方法等四种方法进行比较,根据这四种模型的预测精度,选择在实际税收预测中,简便易行且效果理想的方法。以下我们以我国东部A省地方税务局2000年1月-2008年12月的月度税收收入合计数进行建模,并使用2009年1-4月的实际数据验证预测模型的精度。
一、数据特征分析
文章使用的月度税收收入数据的合计数包括营业税、企业所得税、个人所得税等全部地方税种的月度税收收入。
月度税收收入通常是三个月为一个最小波动周期,1、4、7、10月的税收收入在年度中通常是四个最高值,这与金融保险业营业税和企业所得税季缴因素有关。第二列峰值出现在“3、6、9和12月”,这与收入的“首季开门红、双过半和完成全年收入计划”组织形式非常吻合。“季缴因素”和“收入组织”因素相比较,“季缴因素”影响更大。在年度之间,税收收入呈现出上行的时间趋势。特别是2006年9、10、11月对A省地税部门来说具有里程碑意义,这三个月中,A省地税收入从在百亿元水平下摆动,一举突破百亿元大关,并稳稳地站在百亿元水平之上。如果以三个月为一周期进行移动平均,再以十二个月为周期进行第二次移动平均,可以比较清楚地看出税收收入数据的长期变化趋势。
税收月度收入在我国其他地区也同样表现出这一特征,这里使用我国西部B省国税部门月度收入加以验证。
即使是国税月度税收收入也表现出以三个月为一个最小波动周期的特点,1、4、7、10月的税收收入在年度中通常是四个最高值,第二列峰值出现在“3、6、9和12月”。与东部A省不同的是,西部B省税收收入增长更加平缓,没有出现东部A省2006年9-11月的跳跃式增长。
西部B省国税的月度税收收入长期趋势也呈现出“S”形,在2005年以前缓慢增长,在2005-2008年第一季度进入高速增长时期,2008年以后增速减缓。税收数据说明,西部B省经济快速增长期可能短于东部A省。
这里使用了国税、地税,东部和西部地区的月度税收收入数据进行对比,我们发现月度税收收入数据特征鲜明,在不同区域表现基本一致。这也为下面以东部A省数据为例说明月度预测方法奠定了基础。
二、预测方法及其结果
(一)指数平滑方法
指数平滑方法可以通过调整对时间序列中包含的短期趋势的估计,自动追踪数据的变化,实现对短期变动趋势的预测。该方法又包括:一次指数平滑、二次指数平滑、多参数无季节趋势指数平滑和多参数有季节趋势指数平滑。因为月度收入数据的季节性和强烈的时间趋势,这里选用多参数有季节趋势指数平滑法,并使用乘积模型。
由于指数平滑方法是利用税收收入数据自身来实现预测,因此不存在模型自变量的设定与筛选等问题。我们使用2000年1月-2008年12月数据建立Holter‐Winter季节乘积模型,利用2009年1-4月数据验证模型的效果。计算软件是Eviews6.0。
(二)ARIMA方法
我们对税收收入的自然对数取两次差分后绘制自相关图,可以看出,在滞后3期、6期、9期和12期的自相关系数分别是0.722、0.717、0.647和0.676,显着不为0。说明税收收入数据具有强烈的季节趋势。对税收收入自然对数值逐期差分,并以12个月为步长进行季节差分,获得新序列称之为“季节调整后税收收入自然对数值”。