[关键词]: 农业总产值、农业从业人员、户均生产原值、耕地面积、农业机总动力、灌溉面积、化肥施用量、出口额、进口额。
[内容提要]:
农业是国民经济的基础,它关系到我国的经济发展和社会稳定,可以说,目前“三农”问题是举国上下关注的焦点。在近几年中,农业总产值出现了一些波动,在这里,我们希望通过计量分析的方法找出影响农业总产值变动的因素及其在这些变动中所起的作用,并对这些现象作出合理的解释。
前言
众所周知,中国是一个农业大国,中国用不到占全世界7%的耕地养活了占世界20%的人口,这是一项举世瞩目的成就。据2003年中国农业统计年鉴,2002年我国农业总产值达到452.85亿元。
农业总产值受自然和社会因素的影响都很大。近年来由于自然灾害等各方面因素的影响,我国的农业总产值出现了一些波动。从1998年到2002年,我国的农业总产值分别为:14241.88亿元,14106.22亿元,13873.59亿元,14462.79亿元,14931.54亿元。在讨论中我们发现几个因素可能对此产生影响:第一,伴随着改革开放的进程,城市化进程加快,农村的耕地正因各种原因,以惊人的速度减少。因此,地少人多这一矛盾将长期困扰我国粮食生产。第二,近年来越来越多的农村青壮年劳动力加入进城打工的农民工的行列,农村留守从事种植业的人很多都是老人和小孩。第三,随着科技的进步,各种各样的肥料,新型的灌溉方式,农机具的使用也对农业总产值有着不同程度的影响。第四,在各种农作物中,有些是优良品种很受市场欢迎,但是有些品种却乏人问津,比如,近年来,由于籼型杂交水稻的口感比不上很多优质的新品种,已经逐渐被市场淘汰,而由于我国国产的黄豆品质价格与美国的同类产品相比不占优势,造成国内黄豆的减产,同时大量从美国进口黄豆。由此可以看出,粮食的市场需求和进出口都对粮食的产量有影响。第五,灌溉的面积、病虫害波及范围、程度,各地区土地的种类和分布等都会对粮食的产量造成一定程度的影响。
二.模型的建立
为了验证在我们能够考虑到的范围内的各种因素对某一时点上农业总产值是否有影响以及影响的程度,我们引入如下变量:
设定模型如下:Y=β0+β1X1+β2 X 2+β3 X 3+β4 X 4+β5 X 5+β6 X 6+β7 X 7+β8 X 8+U
通过分析2003年我国31个省市农业总产量的历史资料可建立模型如下:
Y为2002年农业总产值(亿元)
X1----农业从业人员(万元)
X2----户均生产原值(元/每户)
X3----为耕地面积(千公顷)
X4----农业机械总动力(万千瓦)
X5----灌溉面积(千公顷)
X6----化肥施用量(万吨)
X7----出口额(万美元)
X8----进口额(万美元)
设定模型的函数形式如下:Y=β0+β1X1+β2 X 2+β3 X 3+β4 X 4+β5 X 5+β6 X 6+β7 X 7+β8 X 8+U
本模型采用截面数据,数据来源于《中国农业统计年鉴2003》,所取样本见下表:
城市 编号 农业总产值(亿元) 农业从业人员(万人) 元户均固定资产原值(元/户) 耕地面积(千公顷) 农业机械总动力(万千瓦) 灌溉面积(千公顷) 化肥施用量(万吨) 出口额(万美元) 进口额(万美元)
北京 1 90.08 64.1 6258.09 343.9 381.79 387.6 14.9 72277 180290
天津 2 86.06 80.3 7727.96 485.6 612.72 391.75 17.6 30616 34588
河北 3 918.62 1652 6671.58 6883.3 7449.64 4772.06 278.8 48072 36491
山西 4 227.12 658.4 4049.17 4588.6 1869.4 1284.34 89 7710 720
内蒙古 5 332.14 535.7 10936.85 8201 1510.22 2937.99 82.8 22462 2339
辽宁 6 540.09 659.2 4989.95 4174.8 1484.77 1669.23 111.4 74469 44496
吉林 7 419.72 509.1 6470.76 5578.4 1150.67 1569.84 117 10088 2415
黑龙江 8 487.53 745.9 5743.35 11773 1741.75 2190.24 129.7 37911 5871
上海 9 97.21 81.5 2624.32 315.1 126.88 290.3 17.7 56293 98629
江苏 10 1165.5 1354.2 5044.82 5061.7 2983.89 4071.9 337.5 57907 111554
浙江 11 532.16 929.6 8418.75 2125.3 2053.2 1488.87 81.9 92088 58004
安徽 12 718.38 1931.5 4948.81 5971.7 3372.11 3299.48 270.5 24395 4535
福建 13 444.24 756.6 4615.74 1434.7 915.87 982.19 119.9 72975 1460
江西 14 421.49 983.5 2873.95 2993.4 1111.82 1927.89 112.5 8006 727
山东 15 1420.88 2370.9 6029.81 7689.3 8155.63 5311.62 433.9 246185 102651
河南 16 1360.26 3393 5406.91 8110.3 6548.21 4871.43 468.8 23094 24405
湖北 17 671.2 1131 2953.07 4949.5 1557.43 2444.78 257 16333 2286
湖南 18 666.65 2019.6 3192.01 3953 2498.09 2738.83 184.3 1541 5939
广东 19 847.77 1555 4129.87 3272.2 1740.11 2286.35 196.4 193034 242271
广西 20 465.47 1557 3057.75 4407.9 1639.54 1544.67 176.5 21248 29942
海南 21 151.46 181.7 4463.49 762.1 250.31 247.81 29 3093 2192
重庆 22 264.08 852.7 2375.64 665.57 641.25 73.4 7610 461
四川 23 807.45 2503.3 3592.28 9169.1 1803.68 2547.5 209.6 26393 3601
贵州 24 278.89 1353.9 3288.31 4903.5 699.41 674.08 73.6 5687 176
云南 25 445.35 1696.1 4762.47 6421.6 1460.43 1508.9 125 30104 3632
西藏 26 29.08 88.8 17765.63 362.6 73.69 344.01 3 629 411
陕西 27 353.21 994.9 3960.25 5140.5 1208.21 1438.3 131.9 10998 763
甘肃 28 257.26 738.2 4780.36 5024.7 1185.33 1295.19 69.4 5436 1279
青海 29 28.59 136.5 7487.33 688 281.3 364.95 7.2 476 11
宁夏 30 52.88 150.5 12024.13 1268.8 450.61 472.48 25 1287 25
新疆 31 362.77 326 8724.9 3985.7 924.18 4605.63 84.3 37620 3422
三.具体分析过程
对模型进行初步估计,运用OLS估计法对模型中参数进行估计:结果如下
Dependent Variable: Y
Method: Least Squares
Date: 04/29/05 Time: 09:21
Sample: 1 31
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C 1.293109 49.25264 0.026255 0.9793
X1 0.067347 0.037880 1.777882 0.0899
X2 0.000250 0.005244 0.047737 0.9624
X3 0.002959 0.007263 0.407439 0.6878
X4 -0.013125 0.016214 -0.809495 0.4273
X5 0.040209 0.021403 1.878680 0.0742
X6 2.090108 0.374298 5.584077 0.0000
X7 0.001087 0.000455 2.391532 0.0262
X8 0.000212 0.000403 0.524726 0.6053
R-squared 0.969879 Mean dependent var 489.3170
Adjusted R-squared 0.958405 S.D. dependent var 374.3294
S.E. of regression 76.34435 Akaike info criterion 11.75171
Sum squared resid 122397.7 Schwarz criterion 12.17207
Log likelihood -167.2757 F-statistic 84.52395
Durbin-Watson stat 2.037974 Prob(F-statistic) 0.000000
分析:
由上可以看出在5%的显著性水平下F=84.52395>F(8,22)=2.40,表明模型整上看农业总产与解释变量之间线性关系显著。但是X4的系数为负,与其经济意义相悖,而且常数项、X1、X2、X3、X4、X5、X8的T检验值都不显著,因此需要对模型的多重共线性进行检验。
(一)对模型进行多重共线性的检验:
计算解释变量间的相关系数
Y X1 X2 X3 X4 X5 X6 X7 X8
Y 1 0.8525705 -0.2954257 0.6025771 0.8509786 0.8566274 0.9680397 0.5296497 0.2749907
X1 0.8525705 1 -0.3941414 0.6287159 0.733896 0.6799771 0.866022 0.2601562 0.0518853
X2 -0.2954257 -0.3941414 1 -0.218498 -0.11404 -0.0929822 -0.3070284 -0.0866474 -0.1267679
X3 0.6025771 0.6287159 -0.218498 1 0.5452352 0.6445189 0.6078675 0.0871383 -0.1909085
X4 0.8509786 0.733896 -0.11404 0.5452352 1 0.8289078 0.8637007 0.4666648 0.1489388
X5 0.8566274 0.6799771 -0.0929822 0.6445189 0.8289078 1 0.8459467 0.3746601 0.099379
X6 0.9680397 0.866022 -0.3070284 0.6078675 0.8637007 0.8459467 1 0.4080069 0.1698765
X7 0.5296497 0.2601562 -0.0866474 0.0871383 0.4666648 0.3746601 0.4080069 1 0.7371095
X8 0.2749907 0.0518853 -0.1267679 -0.1909085 0.1489388 0.099379 0.1698765 0.7371095 1
可以看出解释变量间存在高度线性相关。表明模型中确实存在严重的多重共线性。
修正:
1 运用OLS法逐一求对各个解释变量的回归。结合经济意义和统计检验选出拟合效果最好的一元线性回归方程。经分析Y对X6的线性关系强,如下图所示,两者趋势较一致,拟合程度最好,所以从X6开始进行逐步回归。
2 利用EVIWS逐步回归修正
Y=64.47880+2.989894X6
(2.465609) (20.90158)
Adjusted R-squared=0.935605 F-statistic=436.8761
再将其余解释变量逐一添加,由T-检验值,Adjusted R-squared值,F-检验值综合评估,得到以下的模型拟合效果为最优:
Y=48.83128+0.032959X5+2.640594X6
782918) (1.571097) (10.05940)
Adjusted R-squared=0.938709 F-statistic=230.7323
Y=36.34899+0.0282845X5+2.489372X6+0.001063X7
(1.604827) (1.643220) (11.39764) (3.846975)
Adjusted R-squared=0.958943
Dependent Variable: Y
Method: Least Squares
Date: 04/29/05 Time: 10:10
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob.
C 36.34899 22.64979 1.604827 0.1202
X5 0.028284 0.017213 1.643220 0.1119
X6 2.489372 0.218411 11.39764 0.0000
X7 0.001063 0.000276 3.846975 0.0007
R-squared 0.963048 Mean dependent var 482.0513
Adjusted R-squared 0.958943 S.D. dependent var 370.2544
S.E. of regression 75.02311 Akaike info criterion 11.59338
Sum squared resid 151968.6 Schwarz criterion 11.77841
Log likelihood -175.6974 F-statistic 234.5624
Durbin-Watson stat 1.931630 Prob(F-statistic) 0.000000
经上述逐步回归分析可知Y对X5,X6,X7以及常数项的回归模型为最优。
(二)对模型进行异方差的检验
由于我们获得的数据是截面数据,无法采用ARCH检验,又因为该模型有3个解释变量,不适用于需要排序的Goldfeld-Quandt检验,所以我们采用WHITE 检验对该模型进行异方差检验。
WHITE 检验
White Heteroskedasticity Test:
F-statistic 2.068557 Probability 0.081746
Obs*R-squared 14.56767 Probability 0.103517
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 04/29/05 Time: 10:40
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob.
C -2255.144 2597.450 -0.868215 0.3951
X5 3.478479 5.304476 0.655763 0.5191
X5^2 -0.002744 0.001189 -2.308681 0.0312
X5*X6 0.010756 0.022519 0.477619 0.6379
X5*X7 0.000260 0.000103 2.532721 0.0194
X6 44.51448 61.51357 0.723653 0.4773
X6^2 0.040739 0.185061 0.220136 0.8279
X6*X7 -0.002801 0.001312 -2.135584 0.0447
X7 0.042158 0.064607 0.652526 0.5211
X7^2 -5.04E-07 5.57E-07 -0.903683 0.3764
R-squared 0.469925 Mean dependent var 4902.214
Adjusted R-squared 0.242750 S.D. dependent var 6126.889
S.E. of regression 5331.627 Akaike info criterion 20.25640
Sum squared resid 5.97E+08 Schwarz criterion 20.71897
Log likelihood -303.9742 F-statistic 2.068557
Durbin-Watson stat 1.853841 Prob(F-statistic) 0.081746
可知Obs*R-squared=14.56767<x(9)=16.9190所以不存在异方差
(三)对模型进行自相关性的检验
由D-W=1.931630,给定显著性水平a=0.05,查durbin-watson表,n=31,k=3得下限临界值dL=1.229和上限临界值du=1.650由du<1.931630<4-du,所以不存在一阶自相关.
模型确立:
综上所述,模型经过多重共线性的检验、修正,自相关、异方差的检验后可以确定为:
Y=36.34899+0.0282845X5+2.489372X6+0.001063X7
修改后的模型不存在自相关性和异方差,说明模型的拟合效果是不错的。
四.模型解释及存在问题
(一)经济解释
经过分析我们所确立的模型,灌溉面积、化肥施用量、出口额都是影响农业总产值的主要因素,并且它们与农业总产值呈正相关关系,其中,灌溉面积每增加1单位,农业总产值增加约0.03单位;化肥施用量每增加1单位,可以使农业总产值增加约2.5单位;另外出口额对农业总产值也有一定影响。从模型还可以看出解释变量“农业从业人员”对被解释变量“农业总产值”的影响不显著,说明我国农业从业人员的边际劳动生产率不高,因此,可以认为劳动生产率是制约今后我国农业总产值增长的一个亟待解决的问题。另外,农业机械总动力的影响也是不显著的,验证了目前我国农业机械化水平不高的现实。
综上所述,我国农业总产值的增长结构是不合理的。原因在于农业机械化程度和劳动生产率对其的影响是不显著的,而化肥的施用量在我们采用的变量中对农业产值的影响却是最大的。化肥的采用的确可以在短期内大幅度的提高总产值,但是化肥对土地和生态的破坏也是有目共睹的,从长远来看,如果靠不断增加化肥的施用量来提高农业总产值是不合理的,也是不符合可持续发展的要求的。因此,结合现阶段我国资源消耗大产出却相对较低的国情,今后我国农业总产值的增长还是应该多在提高资源的利用效率上下功夫。只有这样才能以较小的成本获得较大的产出。
(二)存在的问题
根据先验信息,户均生产原值及耕地面积对农业总产值的影响应该是显著的,对它们的删除可能是不正确的,但是,由于数据的缺失以及一些其他的制约因素,如果不删除该变量,多重共线性又无法消除,这在一定程度上影响了模型的解释效力。
另外由于我们自身认识水平有限,在建立模型的过程中可能忽略了一些影响因素,使模型本身具有一些固有的缺陷,影响我们的分析结论。
[参考文献]:
1、《计量经济学》 主编:庞皓 西南财经大学出版社 2001年8月第一版
2、《中国统计年鉴2003》
3、《中国农业统计年鉴(2003年)》