我国人均GDP与消费的计量分析模型的数据来源:
表1 消费模型样本观测值
年份 人均消费(Y) 人均GDP(X1) 前期人均消费(X2)
1978 184.0000 379.0000 165.0000
1979 207.0000 417.0000 184.0000
1980 236.0000 460.0000 207.0000
1981 262.0000 489.0000 236.0000
1982 284.0000 526.0000 262.0000
1983 311.0000 582.0000 284.0000
1984 354.0000 695.0000 311.0000
1985 437.0000 855.0000 354.0000
1986 485.0000 956.0000 437.0000
1987 550.0000 1103.000 485.0000
1988 693.0000 1355.000 550.0000
1989 762.0000 1512.000 693.0000
1990 803.0000 1634.000 762.0000
1991 896.0000 1879.000 803.0000
1992 1070.000 2287.000 896.0000
1993 1331.000 2939.000 1070.000
1994 1746.000 3923.000 1331.000
1995 2236.000 4854.000 1746.000
1996 2641.000 5576.000 2236.000
1997 2834.000 6054.000 2641.000
1998 2972.000 6307.000 2834.000
1999 3138.000 6547.000 2972.000
2000 3397.000 7078.000 3138.000
相关数据来自于2001年的《中国统计年鉴》
一.初步估计并建立的模型
建模目的:本文主要建立计量模型来说明居民人均GDP与居民人均消费之间的关系。
变量设定:以我国居民人均消费额(元)作为被解释变量(Y),以我国人均GDP(元)(X1)和前期居民人均消费(元)(X2)作为解释变量,简单地阐述了收入对消费的影响。
图1
初步建模:由图1可看出X1,X2均与Y存在明显的线性关系,所以根据建模的目的和要解决的问题,初步估计并建立的模型为:Y=C1+C2*X1+C3*X2+u
运用回归二元线性模型的通用方法最小二乘法即OLS估计模型,可以得到下面方程:
Y = 0.3634178248*X1 + 0.2443593812*X2 + 25.75423521
二、参数估计及检验
应用计量经济软件Eviews进行分析得下表(表2),从而辅助分析T分布检验、多重决定系数检验(F检验)和D-W检验:
表2
Dependent Variable: Y
Method: Least Squares
Date: 04/25/04 Time: 15:07
Sample: 1978 2000
Included observations: 23
Variable Coefficient Std.Error t-Statistic Prob.
X1 0.363418 0.016495 22.03144 0.0000
X2 0.244359 0.038430 6.358482 0.0000
C 25.75424 7.214012 3.570029 0.0019
R-squared 0.999594 Mean dependent var 1209.957
Adjusted R-squared 0.999553 S.D. dependent var 1092.529
S.E. of regression 23.09414 Akaike info criterion 9.238142
Sumsquared resid 10666.79 Schwarz criterion 9.386250
Log likelihood -103.2386 F-statistic 24608.12
Durbin-Watson stat 1.422139 Prob(F-statistic) 0.000000
1.T分布检验
1)进行参数的区间估计,求出模型式的参数C1,C2,C3的置信区间(显著性水平α=0.05):
在此模型中,N=23,k=3;
由表2得C1=25.75424,C2=0.363418,C3=0.244359;
因α=0.05,查t分布表,求出20个自由度的t0.025=2.086;
再由表2得Se(C1)=7.214012,Se(C2)=0.016495,Se(C3)=0.038430;
将数值代入(Ci-tα/2Se(Ci),Ci+ tα/2Se(Ci))(i=1,2,3)式,得参数以95%置信概率的置信区间分别为:
C1: (10.70581,40.80267)
C2: (0.329009,0.397827)
C3: (0.164194,0.324524)
从中可以看出参数C1的置信区间比较大,精确度不是很高。
2)对每个参数估计量进行显著性检验:
同上面给定显著性水平一致,设为α=0.05;
由表2得到各个参数的t统计量t1=3.570029,t2=22.03144,t3=6.358482;
由上面已得20个自由度的统计量的临界值tα/2=2.086;
比较ti与tα/2大小,发现t1,t2,t3均大于t0.025,所以所有的参数均拒绝零假设,即可以认为C1,C2,C3均显著异于零。
综上可得所估计模型通过了T分布检验,数据可与模型拟和。
多重可决系数检验(F检验)
F检验主要用于检验多元线性回归模型总体的显著性,根据计量经济学对F统计量的定义并化简,可得其表达式为F=[ESS/(k-1)]/[RSS/(n-k)];
得到F=24608.12;
同上,显著水平仍为α=0.05,查F分布表,得到F0.05(2,20)=3.49;
由于统计量F之值远远大于临界值F0.05(2,20)之值,所以在显著水平α=0.05下所估计的二元线性回归方程是显著的,即认为Y与X1,X2之间线性相关。
再从F拟合优度来看,由表2得R-squared=0.999594,说明估计方程的拟合优度很高,即所估计模型的总体显著性很好,印证了上述所说。
综上,可得所估计模型通过了多重决定系数检验(F检验),数据可与模型拟和。
3.多重共线性检验
先根据变量显著性与方程显著性来综合判断是否有多重共线性:
从表2可知,可决系数(或修正可决系数)很大,且F值显著大于给定的显著性水平下的临界值, 虽然说对于该模型的F统计值和T统计值的综合判断,似乎是不存在多重共线性,但是由于这个只是对于多重共线性的初步的判断,再考虑到经济活动的继起性,经济变量的滞后值之间通常的都有较强的联系,
再利用简单相关系数矩阵法来进一步判断
X1 X2
X1 1 0.991801
X2 0.991801 1
从上表看出,解释变量之间相关系数都较大,再结合其经济意义进行分析。(变量之间的相关系数都大于0.8)
综上,原估计模型在多重共线性检验上没有通过。即解释变量之间存在多重共线性。
消除估计模型中的多重共线性
由于前期人均消费(X2)会对当期人均消费(Y)产生一定影响,并且参考前面图1能够发现它们间存在一定的线性关系,但是由于前期人均消费(X2)与人均GDP(X1)本身也存在共线性,导致方程的相对误差范围波动相对来说比较大,所以原模型不能精确地反映三个经济变量之间的关系。
克服思路:运用OLS法逐一求Y对各个解释变量回归,结合经济利益和统计检验选出拟合效果最好的回归方程。经分析Y 对X1的线性关系强,拟合程度好。
Dependent Variable: Y
Method: Least Squares
Date: 06/08/04 Time: 20:26
Sample: 1978 2000
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 22.91368 12.21407 1.876008 0.0746
X1 0.467444 0.003576 130.7248 0.0000
R-squared 0.998773 Mean dependent var 1209.957
Adjusted R-squared 0.998714 S.D. dependent var 1092.529
S.E. of regression 39.17594 Akaike info criterion 10.25694
Sum squared resid 32229.85 Schwarz criterion 10.35568
Log likelihood -115.9549 F-statistic 17088.98
Durbin-Watson stat 0.556752 Prob(F-statistic) 0.000000
即;Y=22.91368+0.467444X1
R-squared=0.998773 F-statistic=17088.98
逐步回归:将X2带入上方程,得到:
Dependent Variable: Y
Method: Least Squares
Date: 06/08/04 Time: 20:29
Sample: 1978 2000
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 25.75424 7.214012 3.570029 0.0019
X1 0.363418 0.016495 22.03144 0.0000
X2 0.244359 0.038430 6.358482 0.0000
R-squared 0.999594 Mean dependent var 1209.957
Adjusted R-squared 0.999553 S.D. dependent var 1092.529
S.E. of regression 23.09414 Akaike info criterion 9.238142
Sum squared resid 10666.79 Schwarz criterion 9.386250
Log likelihood -103.2386 F-statistic 24608.12
Durbin-Watson stat 1.422139 Prob(F-statistic) 0.000000
Y=25.75424+0.363418X1+0.244359X2
R-squared=0.999594 F-statistic=24608.12
拟合度有所提高,但对统计检验值有影响,可认为新解释变量引起了共线性,所以按照经济意义判断,在这两个共线程度高的变量中,舍去对经济意义影响力相对次要的一个X2,保留相对重要的一个X1。
新的模型方程为:Y=22.91368+0.467444X1
4.异方差检验
利用Goldfeld-Quandt检验法,现在先将观测值按解释变量的大小顺序排列,将中间的9个样本删除掉,则剩下的观测值分为2部分,每部分观测值个数为7,并计算2个子样本的残差的均方差所构成的比,以此统计量来判断是否存在异方差。提出假设检验H0:Ui为同方差性; H1:Ui为异方差性
对第一个样本进行回归,从OLS方法求得结果
Dependent Variable: Y
Method: Least Squares
Date: 06/08/04 Time: 20:54
Sample: 1978 1984
Included observations: 7
Variable Coefficient Std. Error t-Statistic Prob.
C -15.86480 19.88027 -0.798017 0.4611
X1 0.549339 0.038498 14.26932 0.0000
R-squared 0.976032 Mean dependent var 262.5714
Adjusted R-squared 0.971239 S.D. dependent var 59.34604
S.E. of regression 10.06459 Akaike info criterion 7.690881
Sum squared resid 506.4801 Schwarz criterion 7.675426
Log likelihood -24.91808 F-statistic 203.6135
Durbin-Watson stat 1.018128 Prob(F-statistic) 0.000030
Y=-15.86480+0.549339X1
R-squared= 0.976032 Sum squared resid1=506.4801 (令为E1)
对第二个样本进行回归,从OLS方法求得结果
Dependent Variable: Y
Method: Least Squares
Date: 06/08/04 Time: 20:48
Sample: 1994 2000
Included observations: 7
Variable Coefficient Std. Error t-Statistic Prob.
C -295.7312 48.91952 -6.045261 0.0018
X1 0.521434 0.008364 62.33909 0.0000
R-squared 0.998715 Mean dependent var 2709.143
Adjusted R-squared 0.998458 S.D. dependent var 562.4205
S.E. of regression 22.08498 Akaike info criterion 9.262629
Sum squared resid 2438.733 Schwarz criterion 9.247175
Log likelihood -30.41920 F-statistic 3886.162
Durbin-Watson stat 2.470029 Prob(F-statistic) 0.000000
Y=-295.7312+0.521434X1
R-squared= 0.998715 Sum squared resid2=2438.733 (令为E2)
F统计量 F=E2/E1=4.815 给定显著性水平α=0.05 ,得临界值
F0.05(4,4)=6.39 比较F=4.815<6.39则接受原假设,表明随机误差不存在异方差。
5.自相关检验
D-W检验
D-W检验主要用于检验随机扰动项有无自相关存在。由表2可得DW=1.018;
已知显著性水平α=0.01,T=23,K=2从D-W检验表中查得dL=1.018,dU=1.187;
因为dL<DW<dU,所以在α=0.01水平下,不能确定序列是否存在自相关,即D-W检验失效,同时由于本身该模型再设定时就是一个自回归模型,对于自回归模型D-W检验是失效的,以上结论正好应证了这一点。到此,必须采用其它方法进行序列相关检验,可采用下面的图示法检验。
图示法检验
通过估计模型计算出Y的估计值YF,并由此算出真实值与估计值间的误差(即残差),以残差(记作Et)作为被解释变量,以滞后一期的残差(记作E(t-1))为解释变量,绘制Et与E(t-1)的二维坐标图,如下图所示:
图2
从散布点(E(t-1),Et)的分布来看,能判断出Et(或u)的序列不存在一阶线性自相关。
综上,原估计模型通过了序列相关检验。
三、确定最终的模型
通过观察发现克服多重共线性后所得的回归方程与最开始回归出的估计方程不是一样的,通过检验和修正后的新模型能较好的拟合经济统计数据,也能较真实地反映此经济现象。
综上可得,上面的回归方程可作为最终确定的计量模型:
Y=-295.7312+0.521434X1
Y:我国居民人均消费额(元)
X1:我国人均GDP(元)
四、实证分析
从以上分析以及所得最终模型方程我们可以看出,人均GDP每增加一元,那么人均消费就会增加0.52元左右。这符合我们的国情,也符合宏观经济理论框架。所以,此模型基本上说明了我国的居民平均消费水平和人均GDP之间的关系。
由于分配机制和收入水平的变化,我国居民消费需求出现了一些新的特点。在物质消费质量不断提高的同时,居民用于休闲、娱乐和旅游等服务性消费支出的比重和数量也在逐步增加,存在一些多元化的影响。但是,在一定的时期内,我国的居民的消费仍主要由我国的人均GDP决定。所以,在研究居民消费的时候,就应该多研究如何提高我国的人均GDP,以真正提高我国居民的生活水平和生活质量。
所以我提出以下政策建议
1.提高我国的人均GDP还是我国经济发展的头等大事,从模型中不难看出人均GDP和人均消费的比例关系,说明人均GDP对人均消费起的是决定性作用,没有GDP的总量作后盾,根本不用谈消费的问题,有了一定量的GDP,消费水平的提高才有空间;
2.重视居民的服务性消费支出,在中国产业调整中,第三产业比重逐渐上升,因此重视居民的服务性消费支出,就是重视第三产业的发展,而第三产业繁荣了,我国居民的生活水平和生活质量自然也就提高了;
3.应该把第三产业的发展和我国GDP的提高兼顾起来,由于第三产业的发展,肯定会在一定程度上阻碍或影响第一、第二产业的发展,从而很有可能成为我国GDP增长的阻力,而GDP是经济发展的命脉,这种阻力也势必影响到第三产业,所以如果把这两个方面协调不好,我国经济很有可能停滞不前,更不用说居民生活水平的提高了。
总之,在第三产业逐步壮大的同时调整好经济结构,使我国的GDP能够稳步增长,这才是解决和提高我国居民生活水平和质量的有效途径。