第二产业GDP增长的多因素分析
主要内容:从1978年至今,第二产业的GDP占GDP总量的比重逐年提高,到2003年,已经达到52%。第二产业的发展对于国民经济的发展至关重要。本文旨在研究资本、劳动、教育水平与第二产业GDP形成的关系。
关键字:生产函数,就业人数,资本形成额,教育支出
一、经济理论:
产出增长是通加增加要素投入和通过源于技术进步所导致的生产率提高和生产能力更强的劳动大军实现的。生产函数提供了投入与产出之间的数量关系。 若仅考虑劳动和资本,生产函数的一般公式是Y=AF(K,N) ,即产出Y取决于资本和劳动投入(K,L)和技术水平A。特别的,对柯布-道格拉斯函数,有Y=AKaLb。这个函数可以对经济进行比较准确的描述,例如,对美国而言,a=0.25,b=0.75与其现实经济相当相近。
除此之外,自然资源和人力资本也是两种重要的投入。人力资本投资即通过学校教育,在职培训和其他手段来增加工人的技巧和才能,这与实物投资导致的实物资本增加是相同的。增加了人力资本H的生产函数可以写做:Y=AF(K,H,N)。在工业化国家中,人力资本的要素分额较大,比如曼昆的一篇文章中就指出,生产函数中实物资本,非熟练劳动力和人力资本的要素分额各占1/3。
二、模型的建立和数据搜集:
由Y=A*F(K,H,L),若生产函数采用类似柯布-道格拉斯生产函数的形式,并进行对数变换得到:
LNY=LNA+aLNK+bLNL+cLNH
用Y代表第二产业GDP,K与L分别代表资本和劳动投入,人力资本用教育费用支出E代替,可以得到以下模型:
LNY=C+aLnK+blnL+clnE+u
数据:
年份 第二产业就业人数 第二产业GDP 教育费用支出 资本形成
1978 6945 1745.2 75.05 1377.9
1979 7214 1913.5 93.16 1474.2
1980 7707 2192 114.15 1590
1981 8003 2255.5 122.79 1581
1982 8346 2383 137.61 1760.2
1983 8679 2646.2 155.24 2005
1984 9590 3105.7 180.88 2468.6
1985 10384 3866.6 226.83 3386
1986 11216 4492.7 274.72 3846
1987 11726 5251.6 293.93 4322
1988 12152 6587.2 356.66 5495
1989 11976 7278 412.39 6095
1990 13856 7717.4 462.45 6444
1991 14015 9102.2 532.39 7517
1992 14355 11699.5 621.71 9636
1993 14965 16428.5 754.9 14998
1994 15312 22372.2 1018.78 19260.6
1995 15655 28537.9 1196.65 23877
1996 16203 33612.9 1415.71 26867.2
1997 16547 37222.7 1545.82 28457.6
1998 16600 38619.3 1726.3 29545.9
1999 16421 40557.8 1927.32 30701.6
2000 16219 44935.3 2179.52 32499.8
2001 16284 48750 2636.84 37460.8
2002 15780 52980.2 3105.99 42304.9
2003 16077 61274.1 3351.32 51382.7
将所有数据取对数后输入EVIEWS
从经济意义上考虑到当年的教育支出对产出的影响可能存在滞后,采用Granger检验,可以得到当之后长度为2时,E是引起Y变化的原因,故模型修改为:
LNY=C+aLnK+blnL+clnE(-2)+u
三、模型的估计和检验:
1)平稳性检验:单位根检验
Lny ADF 一阶差分 只有截距项 滞后3阶
ADF Test Statistic -2.807303 1% Critical Value* -3.7856
5% Critical Value -3.0114
10% Critical Value -2.6457
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(LNY,2)
Method: Least Squares
Date: 06/14/05 Time: 10:15
Sample(adjusted): 1983 2003
Included observations: 21 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(LNY(-1)) -0.581207 0.207034 -2.807303 0.0126
D(LNY(-1),2) 0.597357 0.218600 2.732652 0.0148
D(LNY(-2),2) 0.018730 0.222544 0.084165 0.9340
D(LNY(-3),2) 0.293551 0.207049 1.417785 0.1754
C 0.090017 0.033464 2.689959 0.0161
R-squared 0.446263 Mean dependent var 0.004307
Adjusted R-squared 0.307828 S.D. dependent var 0.066967
S.E. of regression 0.055715 Akaike info criterion -2.732888
Sum squared resid 0.049666 Schwarz criterion -2.484192
Log likelihood 33.69532 F-statistic 3.223642
Durbin-Watson stat 1.883066 Prob(F-statistic) 0.040398
以10%的标准LNY不存在单位根,一阶差分平稳。
LNK ADF 一阶差分 只有截距项 滞后3阶
ADF Test Statistic -3.012373 1% Critical Value* -3.7856
5% Critical Value -3.0114
10% Critical Value -2.6457
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(LNK,2)
Method: Least Squares
Date: 06/14/05 Time: 10:19
Sample(adjusted): 1983 2003
Included observations: 21 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(LNK(-1)) -0.898176 0.298162 -3.012373 0.0083
D(LNK(-1),2) 0.404224 0.258497 1.563749 0.1374
D(LNK(-2),2) 0.282612 0.240281 1.176175 0.2567
D(LNK(-3),2) 0.310454 0.227736 1.363218 0.1917
C 0.141537 0.049395 2.865403 0.0112
R-squared 0.380186 Mean dependent var 0.004144
Adjusted R-squared 0.225232 S.D. dependent var 0.102694
S.E. of regression 0.090392 Akaike info criterion -1.765057
Sum squared resid 0.130733 Schwarz criterion -1.516361
Log likelihood 23.53309 F-statistic 2.453546
Durbin-Watson stat 2.004426 Prob(F-statistic) 0.088031
以5%的标准,没有单位根,一阶差分平稳。
LNL ADF只有截距项和趋势 滞后1阶一阶差分
ADF Test Statistic -3.628678 1% Critical Value* -4.4167
5% Critical Value -3.6219
10% Critical Value -3.2474
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(LNL,2)
Method: Least Squares
Date: 06/14/05 Time: 10:22
Sample(adjusted): 1981 2003
Included observations: 23 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(LNL(-1)) -1.303252 0.359153 -3.628678 0.0018
D(LNL(-1),2) 0.019683 0.227961 0.086346 0.9321
C 0.105447 0.033455 3.151939 0.0052
@TREND(1978) -0.004507 0.001580 -2.852753 0.0102
R-squared 0.632964 Mean dependent var -0.002063
Adjusted R-squared 0.575011 S.D. dependent var 0.051344
S.E. of regression 0.033472 Akaike info criterion -3.799468
Sum squared resid 0.021287 Schwarz criterion -3.601991
Log likelihood 47.69389 F-statistic 10.92201
Durbin-Watson stat 1.991014 Prob(F-statistic) 0.000216
以5%的标准,没有单位根,一阶差分平稳
LNE(-2) ADF 有趋势和截距项 滞后1阶一阶差分
ADF Test Statistic -4.419992 1% Critical Value* -4.4415
5% Critical Value -3.6330
10% Critical Value -3.2535
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(LNE1,2)
Method: Least Squares
Date: 06/14/05 Time: 11:28
Sample(adjusted): 1982 2003
Included observations: 22 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(LNE1(-1)) -1.577432 0.356886 -4.419992 0.0003
D(LNE1(-1),2) 0.205990 0.219247 0.939531 0.3599
C 0.018412 0.035967 0.511912 0.6149
@TREND(1978) -0.001323 0.002272 -0.582098 0.5677
R-squared 0.702869 Mean dependent var 0.001932
Adjusted R-squared 0.653348 S.D. dependent var 0.113284
S.E. of regression 0.066698 Akaike info criterion -2.414312
Sum squared resid 0.080076 Schwarz criterion -2.215940
Log likelihood 30.55743 F-statistic 14.19315
Durbin-Watson stat 2.064102 Prob(F-statistic) 0.000054
以5%的标准,没有单位根,一阶差分平稳
综上,模型中的变量都是一阶差分平稳。对变量进行回归LS LNY C LNK LNL LNE(-2)
Dependent Variable: LNY
Method: Least Squares
Date: 06/14/05 Time: 11:31
Sample(adjusted): 1980 2003
Included observations: 24 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 3.612380 1.046778 3.450951 0.0025
LNK 0.920368 0.075645 12.16690 0.0000
LNL -0.387481 0.141687 -2.734767 0.0128
LNE(-2) 0.164260 0.067373 2.438081 0.0242
R-squared 0.998259 Mean dependent var 9.374063
Adjusted R-squared 0.997998 S.D. dependent var 1.164977
S.E. of regression 0.052123 Akaike info criterion -2.919421
Sum squared resid 0.054336 Schwarz criterion -2.723078
Log likelihood 39.03305 F-statistic 3823.231
Durbin-Watson stat 0.654112 Prob(F-statistic) 0.000000
R2=0.998259 拟合程度很好, F=3823.231 通过了F检验,模型设定正确。
回归结果,得:
LNY=3.612380 +0.920368LNK—0.387481LNL+0.164260LNE(-2)
(各参数均通过T检验)
对残差项进行平稳性检验,单位根检验
0阶,没有趋势和截距,滞后一阶
ADF Test Statistic -2.108609 1% Critical Value* -2.6756
5% Critical Value -1.9574
10% Critical Value -1.6238
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(R2)
Method: Least Squares
Date: 06/14/05 Time: 11:34
Sample(adjusted): 1982 2003
Included observations: 22 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
R2(-1) -0.460598 0.218437 -2.108609 0.0478
D(R2(-1)) 0.260993 0.238624 1.093744 0.2871
R-squared 0.146646 Mean dependent var -0.008221
Adjusted R-squared 0.103978 S.D. dependent var 0.040171
S.E. of regression 0.038026 Akaike info criterion -3.614601
Sum squared resid 0.028919 Schwarz criterion -3.515415
Log likelihood 41.76061 F-statistic 3.436934
Durbin-Watson stat 1.816806 Prob(F-statistic) 0.078563
以5%的标准,没有单位根,平稳。说明存在协整。
故说明以上长期关系方程的变量选择合理,回归系数具有经济意义,即:
LNY=3.612380 +0.920368LNK—0.387481LNL+0.164260LNE(-2)
误差校正:
LNYI=LNYt—LNYt-1 LNKI=LNKt—LNKt-1 LNLI=LNLt—LNLt-1 LNEI=LNEt—LNEt-1 R=RESID
Dependent Variable: LNY1
Method: Least Squares
Date: 06/14/05 Time: 10:52
Sample(adjusted): 1983 2003
Included observations: 21 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 0.021363 0.005304 4.027509 0.0012
LNK1 0.894032 0.019287 46.35385 0.0000
LNK1(-1) 0.100811 0.019553 5.155697 0.0001
LNL1 -0.295141 0.036564 -8.071920 0.0000
R 0.975203 0.041411 23.54945 0.0000
R(-1) -0.833137 0.051257 -16.25424 0.0000
LNE1(-4) -0.070198 0.027907 -2.515395 0.0247
R-squared 0.996762 Mean dependent var 0.154619
Adjusted R-squared 0.995374 S.D. dependent var 0.083807
S.E. of regression 0.005700 Akaike info criterion -7.235415
Sum squared resid 0.000455 Schwarz criterion -6.887241
Log likelihood 82.97185 F-statistic 718.2057
Durbin-Watson stat 2.664799 Prob(F-statistic) 0.000000
回归得到短期动态方程:
LNY1=0.021363+0.894032LNK1+0.100811LNK1(-1)-0.295141LNL1
0.070198LNE1(-4)+0.975203R-0.833137R(-1)
2)计量经济学检验
对长期模型进行异方差检验:
ARCH Test:
F-statistic 0.874324 Probability 0.473763
Obs*R-squared 2.807036 Probability 0.422343
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/15/05 Time: 11:45
Sample(adjusted): 1983 2003
Included observations: 21 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 0.001658 0.001337 1.240691 0.2316
RESID^2(-1) 0.234269 0.366240 0.639659 0.5309
RESID^2(-2) -0.332276 0.348164 -0.954367 0.3533
RESID^2(-3) 0.412818 0.354709 1.163822 0.2606
R-squared 0.133668 Mean dependent var 0.002230
Adjusted R-squared -0.019214 S.D. dependent var 0.003111
S.E. of regression 0.003141 Akaike info criterion -8.519183
Sum squared resid 0.000168 Schwarz criterion -8.320227
Log likelihood 93.45143 F-statistic 0.874324
Durbin-Watson stat 1.693624 Prob(F-statistic) 0.473763
T值都小于2,没有异方差
White Heteroskedasticity Test:
F-statistic 2.726168 Probability 0.048331
Obs*R-squared 11.76869 Probability 0.067333
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/30/05 Time: 18:41
Sample: 1980 2003
Included observations: 24
Variable Coefficient Std. Error t-Statistic Prob.
C -2.580482 1.840997 -1.401676 0.1790
LNK -0.015230 0.056131 -0.271337 0.7894
LNK^2 0.001046 0.002995 0.349129 0.7313
LNL 0.579411 0.418662 1.383958 0.1843
LNL^2 -0.029895 0.021690 -1.378280 0.1860
LNE(-2) -0.050031 0.027073 -1.847972 0.0821
LNE(-2)^2 0.003506 0.002038 1.720563 0.1035
R-squared 0.490362 Mean dependent var 0.002264
Adjusted R-squared 0.310490 S.D. dependent var 0.002979
S.E. of regression 0.002473 Akaike info criterion -8.928022
Sum squared resid 0.000104 Schwarz criterion -8.584423
Log likelihood 114.1363 F-statistic 2.726168
Durbin-Watson stat 2.184959 Prob(F-statistic) 0.048331
T值都小于2,所以没有异方差。
长期模型存在自相关,使用迭代法修正
Dependent Variable: LNY
Method: Least Squares
Date: 06/15/05 Time: 12:18
Sample(adjusted): 1981 2003
Included observations: 23 after adjusting endpoints
Convergence achieved after 21 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 0.522507 2.084584 0.250653 0.8049
LNK 0.771015 0.077127 9.996704 0.0000
LNL 0.024540 0.240499 0.102039 0.9199
LNE(-2) 0.249664 0.083081 3.005075 0.0076
AR(1) 0.722863 0.174581 4.140569 0.0006
R-squared 0.999181 Mean dependent var 9.447171
Adjusted R-squared 0.998999 S.D. dependent var 1.133470
S.E. of regression 0.035853 Akaike info criterion -3.629138
Sum squared resid 0.023137 Schwarz criterion -3.382291
Log likelihood 46.73508 F-statistic 5492.676
Durbin-Watson stat 1.739477 Prob(F-statistic) 0.000000
Inverted AR Roots .72
样本容量23个,3个解释变量,查表,得:Du=1.660,DW=1.739477>1.660且<2.340
经修正后,不存在自相关。
经过修正后得到的长期模型为:
Lny =0.522507+0.771015Lnk+0.024540Lnl+0.249664Lne(-2)+u
对长期模型进行多重共线检验:
LNE(-2) LNK LNL
LNE(-2) 1.000000 0.988701 0.932551
LNK 0.988701 1.000000 0.953239
LNL 0.932551 0.953239 1.000000
具有比较严重的多重共线性。使用逐步回归法进行修正,不能删除解释变量。
3)经济意义检验:
综上可得:
Lny =0.522507+0.771015Lnk+0.024540Lnl+0.249664Lne(-2)
可以转化为:Y=e0.522507K0.771015L0.024540E(-2)0.249664
可见,在第二产业中,资本投入对gdp的贡献是最大的,资本投入产出弹性为0.771015;人力资本产出弹性为0.249664;而劳动产出弹性为0.024540,十分不显著——但是这和中国目前的现实不符合,资本投入产出弹性过高而劳动产出弹性过低。这是由于解释变量之间存在严重的多重共线性,从而使得估计结果无偏但无效,无法真实的描述各因素对我国第二产业GDP贡献的真实情况。
4、失败原因分析和经验教训总结:
从上面的分析得到,我们的模型无法达到对促进第二产业GDP的各因素进行正确描述的目的。失败的原因主要有:
由于资本,劳动,和人力资本三者之间存在着互相替代的关系,所以三个解释变量之间存在严重的多重共线性,而且无法进行修正。目前我们没有办法解决这个问题。
第二产业包括工业和建筑业,由于数据的原因,并且工业的GDP比建筑业大出许多,因此我们只是笼统的对第二产业整体进行了分析。但这两者之间是存在差异的,这样使我们的原始数据和分析出现偏差。
在这次做^论文的过程中,我们有很多遗憾,也从很多次失败中学到了东西。
我们是三易题目。第一次想要做有关银行的盈利性,流动性和安全性之间的分析;第二次是尝试了金融发展对中国GDP的影响。最后才换到现在的题目。最深刻的感受就是:每次我们都是一想到某个题目,就马上开始查找数据,输入数据开始回归,但是没有认真的对背后的经济理论进行思考和分析,没有认真想做这个题目的目的和意义何在?所以,在每次回归的结果出现问题的时候,我们没有尝试从经济意义方面进行分析,就忙着换解释变量,修改模型的表达式,总之就是千方百计要让回归的数据“合理完美”。当这些努力都徒劳的时候,我们就决定,换题目。的确是完全陷入了“数字陷阱”中。就如同在高中做物理实验的时候,根据定理来“修改”自己的实验数据,不是一种严肃的正确的研究问题的态度。这是我们得到的最大的教训,以后一定会引以为戒。