中国GDP的时间序列分析及预测
摘要:本文是基于时间序列理论,并且利用Eviews软件针对我国1981年至2010
年三十年的国内生产总值时间序列数据进行了分析,通过对改革开放30年来的GDP数据进行平稳化处理、模型识别、参数估计,建立时间序列模型,并对模型进行检验,确定较适合模型为自回归移动平均模型ARIMA1,2,2。通过对模型的分析和利用,对我国未来几年的国内生产总值做出预测。即 对2011 年到2015
年的全国GDP 进行了预测,结果表明模型有很好的预测效果。
关键词:时间序列,国内生产总值,ARMA 模型,ARIMA模型,预测
学海无涯苦作舟!
一、 引言
1.1 GDP的概述极其研究意义
国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国力的重要指标。国内生产总值(Gross Domestic Product)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,它反映国家和地区的经济发展及人民生活水平,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。
一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、政府支出和净出口额。用公式表示为:GDP=C+I+G+X。式中:C为消费、I为私人投资、G为政府支出、X为净出口额。可以预见,国内生产总值(GDP)受经济基础、人口增长、资源、科技文化、环境、体制、发展战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的因果模型分析和预测GDP往往比较困难。然而将历年的GDP 作为时间序列,根据过去的数据得出其变化规律,建立预测模型,用此来预测未来的变化,具有着重要的意义。 本文利用我国1981-2010 年度GDP 历史数据为样本,利用在研究一个国家或地区经济和商业预测中比较先进适用的时间序列模型之一的ARIMA 模型对样本进行统计分析,以揭示我国GDP 变化的内在规律性,并进行后期预测。深入分析这一指标对于反映我国经济发展历程、探讨增长规律、研究波动状况,制定相应的宏观调控政策有着十分重要的意义。并对未来五年我国经济发展做出预测,为政府制定经济发展战略提供依据。 1.2 时间序列分析方法的简述
时间序列分析是一种广泛应用的数量分析方法,它主要用于描述和探索现象随时间发展变化的数量规律。时间序列是指同一空间、不同时间某一现象的统计指标数值按时间先后顺序形成的一组动态序列。时间序列预测方法则是通过时间
学海无涯苦作舟!
序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。时间序列分析的基本模型有:ARMA模型和ARIMA模型。 时间序列分析预测法,首先将预测目标的历史数据按照时间先后的顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须其它的信息。 1.3 本文的主要工作
从《中国统计年鉴 2011》中选取我国1981 年2010年共30年的GDP作为数据,运用时间序列的分析方法来建立模型,进行模型识别、参数估计和模型检验,并且利用模型来预测未来的GDP。
二、变量选取与数据来源
关于数据的选取方面,由于考虑到改革开放近30年中国的经济高速发展,相比之前的二三十年这个时间段的GDP增速较高,如果很笼统的囊括了六七十年代的数据的话,模型的分析以及预测效果可能并不是非常的理想,或者说和改革开放后的30多年相比,之前的发展阶段不一样的年代的数据对本文所构建模型的分析及预测显得并不是很重要。
下面以我国1981—2010年国内生产总值数据为例,该数据从《中国统计年鉴 2011》中查找。介绍用时间序列分析法对数据分析的过程,并通过其预测2009及2010两年的国内生产总值与实际的国内生产总值比较,选取最为合理的预测方法对未来5年我国GDP的做出预测。实际上2011年的GDP数据已经可以查阅,但为了数据的权威性,选择了《中国统计年鉴 2011》中GDP数据,而且并不影响模型的分析和预测效果。
根据应用时间序列的基本原理知识我们得知,在进行建模之前,首先要对数据进行一些简单的处理。本文主要是对GDP时间序列数据进行平稳性检查,然后再进行平稳化处理。另外本文的实证分析,采用了Eviews软件来对数据进行各种处理和分析。
学海无涯苦作舟!
表2-1 我国1981—2010年国内生产总值(单位:亿元)
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 4891.6 5323.4 5962.7 7208.1 9016 10275.2 12058.6 15042.8 16992.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 184937.4 216314.4 265810.3 314045.4 340506.9 397983 数据来源:《中国统计年鉴 2011》
学海无涯苦作舟!
2.1时间序列平稳性检查
首先我们绘制原始GDP的时间序列图, 从图2-1可以看出我国GDP具有很明显的上升趋势,可以看出原始序列显然是非平稳的。进一步进行ADF单位根检验,从图2-2(原始GDP序列ADF检验)可以看出,检验未能通过,表明原始GDP序列是非平稳的。
图2-1 原始GDP时序图
图2-2 原始GDP序列ADF检验
为了能够对该序列进行分析,则要先使其平稳化。故将选择两种方法:取对数法和差分法,对序时间列进行平稳化处理,从而才可能进一步分析和预测。
学海无涯苦作舟!
2.2 平稳化处理
首先对我国的GDP数据进行对数处理,试图消除此时间序列的非平稳性。把对数化处理过的GDP数据绘制成图,如下所示:
图2-3 LnGDP时序图
图2-4 LnGDP时序ADF检验
通过上面的两个图可以看出,显然对数处理后时间序列仍有明显上升趋势,而且通过单位根检验后可知此序列非平稳。在时间序列的分析应用中,一般来说,可以通过对数据的低阶的差分来提取出曲线趋势的影响,因此下面我们对取对数
学海无涯苦作舟!
后的数据分别进行一、二阶差分,并且验证其平稳性。利用软件操作后的结果如下图所示。
图2-5 LnGDP一阶差分时序图
图2-6 LnGDP一阶差分ADF检验
可以看出,检验结果表明T统计量均大于1%、5%、10%下的检验值,并且其p值也大于0.05,所以我们可以认定差分后的序列是非平稳的。很显然还要再次进行差分,通过软件分析,二阶差分时序图如下:
学海无涯苦作舟!
图2-7 LnGDP二阶差分时序图
现在可以很明显的看出,我们可以认为该时序图其是平稳的,进一步做单位根检验如下:
图2-8 Ln(GDP)二阶差分ADF检验
根据上面的检验结果显示,二阶差分序列在1%的显著性水平下拒绝原假设,接受不存在单位根的结论,p值为0.0009,显著小于0.001,从而我们可以确定二阶差分后序列平稳。根据实际序列的基本知识,我们可以确定Ln(GDP)序列是2阶单整序列,即Ln(GDP)~I(2)。
至此,我们对本文的数据进行了基本的分析,并且对该非平稳时间序列进行了平稳化的处理,下面我们可以开始模型的构建与具体分析了。
学海无涯苦作舟!
三、时间序列模型的构建与分析
3.1 模型的分析和识别
在平稳时间序列自相关函数和偏自相关函数上初步识别ARMA模型阶数p和q,然后利用AIC定则准确定阶数。LnGDP二阶差分后自相关与偏自相关系数如下:
图3-1 Ln(GDP)二阶差分后自相关图
从上图可以看出,二阶差分后序列的自相关系数在滞后二期后呈衰减趋于零,表现为拖尾性;在偏自相关分析图中,滞后四期的偏自相关系数显著不为零,但之后逐渐衰减趋于零,也可以认为序列的偏自相关系数也具有拖尾性,因此阶数p可由显著不为零的偏自相关系数的数目决定,从图中可以看出可以取1也可以取2。为了检验所选模型是否合适,可以采用AIC定则做最优模型识别: AIC函数定义如下:AICnlog22pq
式中:n平稳序列为样本数,2为拟合残差平方和,p,q为参数。 AIC准则定阶方法可写为:AICp,qminAICk,lk,l0kM,0lH
式中:M,N为ARMA模型阶数的上限值,一般取为根号n或n/10。我们在实际应用中p,q的取值一般不超过2。
学海无涯苦作舟!
p 2 0 2 1 1 0 0 1 2 3 2 1 3 3 表3-1 AIC定则模型识别定阶表 q AIC 模型平稳检验 2 -3.84 未通过 3 -3.45 未通过 3 -3.43 通过 2 -3.38 通过 3 -3.31 未通过 2 -3.31 通过 1 -3.27 通过 1 -3.22 通过 1 -3.18 通过 2 -3.15 通过 0 -3.11 通过 0 -3.05 通过 1 -3.05 通过 0 -3.02 通过 AIC值可以通过Eviews软件得出,利用表3-1的结果分析可知,在所有
ARMAp,q模型中,除去未通过的,ARMA2,3最优,ARMA1,2次之,接下来我们分别选择ARIMA2,2,3和ARIMA1,2,2模型进行参数估计。 3.2 模型的参数估计与建立
利用统计软件,我们分别对ARIMA2,2,3和ARIMA1,2,2这两个模型来进行参数估计,相应的图示结果分别如下所示:
图3-2 ARIMA2,2,3模型参数估计
学海无涯苦作舟!
图3-3 ARIMA1,2,2模型参数估计
图3-4 ARIMA2,2,3和ARIMA1,2,2滞后多项式倒数根的分布图
通过分析上面四图中数据以及相应参数估计的结果,我们可以得知,
ARIMA2,2,3和模ARIMA1,2,2型的滞后多项式倒数根均落在单位圆内,满足过程的平稳要求。但是,由于因调整后的AdjustedR2值前者较后者大,而且AIC和SC值前者较后者小,所以相比而言,ARIMA2,2,3模型比ARIMA1,2,2更合适。
学海无涯苦作舟!
3.3 模型的检验
首先画出模型ARIMA2,2,3的残差序列图:
图3-5 ARIMA2,2,3模型的残差图
对然后我们队模型ARIMA2,2,3做残差序列检验,残差相关系数图如下:
图3-6 ARIMA2,2,3模型残差序列检验
上面的结果显示,检验统计量Q值均大于对应自由度卡方分布的检验值,且Prob列读出拒绝原假设的概率很小,均小于0.05,所以残差序列为非白噪声序列,即ARIMA2,2,3模型检验未通过,所以我们只有做出ARIMA1,2,2模型的残差序列图进行检验,分析结果如下:
学海无涯苦作舟!
图3-7 ARIMA1,2,2模型的残差图
图3-8 ARIMA1,2,2模型残差序列检验
上面的结果显示,检验统计量Q值均小于对应自由度卡方分布的检验值,且Prob列读出拒绝原假设的概率较大,均大于0.05,所以残差序列为白噪声序列,即ARIMA1,2,2模型通过检验,所以最终我们选择ARIMA1,2,2模型对我国GDP进行分析预测。即ARIMA1,2,2模型是本文最终所求的模型。
学海无涯苦作舟!
在前面的叙述中,我们以及得出了ARIMA1,2,2模型参数的估计图(如下),这样就可以根据这个图中的数据得到我们想要估计的模型方程了。
根据上图得到ARIMA1,2,2模型为:
2LnGDPt0.4127162LnGDPt1t0.191775t10.780589t2去掉差分形式可得模型为:
Ln(GDP)t2.413612Ln(GDP)t11.825617Ln(GDP)t20.412812Ln(GDP)ut0.191834ut10.780375ut2将对数形式指数化得最终模型为:
GDPe2.413612Ln(GDP)t11.825617Ln(GDP)t20.412812Ln(GDP)ut0.191834ut10.780375ut2
四、结果分析以及主要结论
4.1 我国GDP短期预测及分析
在进行正式预测之前,我们先对已经得知事实的两年数据进行一下预测,然后用这个预测值和实际值进行比较,这样我们就可以得出预测的误差有多大以及我们预测的精度如何。下面我们利用ARIMA1,2,2模型对2009年—2010年
LnGDP进行预测,并且与实际值进行比较。然后由此可计算得到相应的我国2009年—2010年预测GDP值,并且与其实际值进行比较。结果如下:
学海无涯苦作舟!
表4-1 2009年—2010年LnGDP预测与实际值比较
年份 2009 2010
年份 2009 2010 表4-2 2009年—2010年GDP预测值与实际值比较 预测值(亿元) 实际值(亿元) 相对误差 339041.2 397525.3 340506.9 397983 -0.43% -0.12% 预测值(亿元) 12.73388 12.89301 实际值(亿元) 12.73819 12.89416 相对误差 -0.034% -0.009% 通过2009年—2010年的数据验证,结合上面的两个表,我们可以得出预测相对误差误差均小于1%,这样的误差已经很小了,表明模型的选择是正确的,预测效果也是比较优良的。
因此,我们选择ARIMA1,2,2模型对我国未来 5年的GDP作出预测,结果如下。 通过这个GDP的预测图形,我们可以轻松的看出未来几年中国的GDP走势已经大概可能达到的值。
表4-1 20011年—2015年我国GDP预测值
年份 2011 2012 2013 2014 2015 13.52069 744698.5 Ln(GDP)(亿元) 13.05325 13.18678 13.28865 13.40274 ·GDP(亿元)
466608.3 533269.2 590463.4 661817.1 图4-1 2011-2015年我国GDP预测图
学海无涯苦作舟!
4.2小结
从预测结果可以看出在未来的几年我国GDP将保持平稳高速的增长,这也意味着我国的经济将在未来几年会持续稳定的高速发展,到2015年我国的GDP可以达到744698.5亿元人民币。在我国经济水平高速发展的水平下,应该要注意保持经济合理稳定快速的发展,要不断促进产业结构的优化和升级从而满足经济发展的需要。我们应该走新型工业化道路、改变过去粗放型的生产方式,降低能源消耗,不以破坏环境作为工业发展的代价。利用经济发展的新兴力量,大力发展第三产业以及高科技产业以优化现代产业结构,提高人民生活水平,优化资源配置。
本文的思路主要是,首先取对数对数据进行处理,然后进行适当的差分,最后选择适当的较低的模型阶数,则可取得较为理想的预测结果。 文中使用时间序列分析的方法对我国GDP的年度数据序列进行了分析,通过模型分析、识别、检验,最终选定了ARIMA1,2,2模型,并且应用此模型对我国未来几年的GDP做出了预测。可以得知,本文的时间序列短期预测精度是比较高的。由此可见,时间序列预测法是一种重要的预测方法,其模型比较简单,对资料的要求比较单一,只需变量本身的历史数据,在实际中有着广泛的适用性。
当然GDP是国民经济的核心内容,所囊括的内容非常丰富也极其复杂,其本身的决定并非靠简单的一个或多个变量来决定,需要考虑的因素还是非常的多,国内生产总值用公式可以表示为:GDP=C+I+G+X,可以看出影响GDP的因素很多,而不单单是其本身,本文的分析没有考虑到这些因素的影响,这也正是本文时间序列分析的不足之处。
学海无涯苦作舟!
参考文献
[1] 王燕. 应用时间序列分析(第二版)[M]. 北京:中国人民大学出版社,2008 [2] 张丽. 天津市人均GDP时间序列模型及预测[J].区域经济,2007(3) [3] 陈泽中,李锋,杨启智. 中国人均GDP(1952-2002)时间序列分析[J].统计与决策,2005
[4] 成刚,袁佩琪,陈瑾. 北京市人均GDP的时间序列分析及预测[J].生产力研究,2007(3)
[5] [美]弗朗西斯·⋅X·迪博尔德.经济预测[M].北京:中信出版社,2003 [6] 武文婕.ARIMA 模型在GDP预测中的应用[J].中国科技信息,2007.[7] 吴怀宇.时间序列分析与综合[M].武汉大学出版社. 2004:10-98. [8]《中国统计年鉴 2011》
因篇幅问题不能全部显示,请点此查看更多更全内容