影响电信业务收入的主要因素的分析
1949年以前,中国电信系统发展缓慢,到1949年,中国电话的普及率仅为0.05%,电话用户只有26万;到1978年,全国电话容量359万门,用户214万,普及率0.43%;自上世纪80年代中期以来,中国政府加快了基础电信设施的建设,到2004年9月,固定电话用户数达30692.3万户,移 动电话用户32007.1万户。
另一方面,根据《中国统计年鉴》上的数据,我们在发现在第三产业`增加值指数中,通信业的增加值指数是最大的。在1995年是112.1;在1996年是111.4;在1997年是110.8;在1998年是110.6,在1999年是111.3,在2000年是111.5(上年等于100)。显然,电信业对第三产业的发展影响是最显著的。而我们也知道第三产业在GDP中所占的比例是我们衡量一国综合实力的重要指标,从而对电信收入的研究显得尤为重要。
为了研究我国电信业的发展情况,真正了解我国电信业的发展前景,我们选择了电信收入作为我们的被解释变量,选取固定电话用户数、移动电话用户数、互联网用户数、以及电信业固定资产投资完成额作为我们的解释变量
电信收入作为我们的被解释变量,选取固定电话用户数、移动电话用户数、互联网用户数、以及电信业固定资产投资完成额作为我们的解释变量
为了研究当月止电信业务收入累计额y(亿元)与月固定电话用户数x1(亿户)、月移动电话用户数x2(亿户)、月互联网用户数x3(亿户)和当月电信业固定资产投资完成额x4(亿元)的关系,我们需要一定时期的y、x1、x2、x3、x4这五个变量的数据。
通过互联网,我们已经从国家统计局的网站上找到了相关数据。我们选取了2001年1月到2004年9月这45组数据。
数据资料如下:
obs Y X1 X2 X3 X4
2001:01 233.9800 1.482750 0.897590 NA NA
2001:02 496.1200 1.514410 0.949070 NA NA
2001:03 734.4700 1.547380 1.003140 NA 140.5400
2001:04 1013.890 1.574090 1.051980 NA 195.6000
2001:05 1290.090 1.606300 1.110800 NA 540.9000
2001:06 1590.130 1.643710 1.167610 NA 806.0000
2001:07 1962.780 1.668210 1.206050 NA 990.7700
2001:08 2175.900 1.694680 1.257740 NA 1148.900
2001:09 2575.500 1.722700 1.309100 NA 1396.700
2001:10 2879.400 1.747690 1.360190 NA 1700.100
2001:11 3196.500 1.771120 1.399220 NA 1919.000
2001:12 3335.200 1.790340 1.448120 0.361460 2343.700
2002:01 3598.430 1.819310 1.499090 0.363450 2343.700
2002:02 3893.340 1.851420 1.558520 0.362660 2343.700
2002:03 4196.440 1.886500 1.615000 0.375310 2343.700
2002:04 4516.990 1.913180 1.666480 0.385200 2630.900
2002:05 4832.350 1.958540 1.713800 0.387240 2703.610
2002:06 5180.550 1.989420 1.761690 0.397590 2843.000
2002:07 5614.970 2.010230 1.803180 0.417350 2986.980
2002:08 5965.050 2.035290 1.848550 0.433190 3148.390
2002:09 6322.220 2.070010 1.903910 0.450400 3308.920
2002:10 6669.870 2.090620 1.958330 0.458700 3487.300
2002:11 7031.530 2.126840 2.003130 0.482940 3706.680
2002:12 7451.020 2.144190 2.066160 0.497000 4378.270
2003:01 7809.520 2.180040 2.124390 0.487490 4378.270
2003:02 8157.120 2.214920 2.163980 0.492740 4378.270
2003:03 8540.320 2.256260 2.214910 0.499200 4593.270
2003:04 8928.320 2.290390 2.257170 0.507880 4761.970
2003:05 9275.220 2.328820 2.300560 0.522100 4949.770
2003:06 9650.720 2.376100 2.344720 0.532350 5163.370
2003:07 10072.92 2.407540 2.394590 0.538130 5308.670
2003:08 10466.72 2.449260 2.441180 0.544330 5447.670
2003:09 10871.12 2.504680 2.499740 0.538760 5619.070
2003:10 11265.42 2.551390 2.569380 0.535000 5798.670
2003:11 11661.02 2.598420 2.634780 0.532560 6065.970
2003:12 12061.02 2.633050 2.686930 0.536570 6593.470
2004:01 12475.12 2.689330 2.768020 0.554390 6593.470
2004:02 12879.92 2.745320 2.823270 0.546280 6593.470
2004:03 13310.42 2.810810 2.903050 0.545850 6877.870
2004:04 13744.62 2.854480 2.957500 0.541270 7043.870
2004:05 14164.62 2.904010 3.005590 0.536660 7218.870
2004:06 14597.12 2.954880 3.052830 0.534700 7459.870
2004:07 15035.42 2.989960 3.102180 0.530220 7639.570
2004:08 15478.62 3.029010 3.151000 0.528430 7808.470
2004:09 15923.12 3.069230 3.200710 0.523290 7974.670
我们对y和x1 x2 x3 x4 进行初步的散点图观察,发现y和x1 x2 x3 x4 在散点图中呈现出线形关系,所以我们将模型初步定为线形模型。
模型的设定
我们把当月止电信业务收入累计额Y(单位:亿元)作为为应变量,用月平均固定电话用户数X1(单位:亿户)、月平均移动电话用户数X2(单位:亿户)互联网用户数X3(单位:亿户)和每月电信业固定资产投资完成额X4作为四个自变量。建立如下模型:
Yi=β1+β2X1+β3X2+β4X3+β5X4+ui (其中,ui为随机误差项,且服从正态分布)。
利用eviews5.0 得到如下结果
Dependent Variable: Y
Method: Least Squares
Date: 06/14/05 Time: 11:24
Sample (adjusted): 2001M12 2004M09
Included observations: 34 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C -10552.42 1292.392 -8.165032 0.0000
X1 4879.920 1315.285 3.710161 0.0009
X2 1917.691 1093.914 1.753055 0.0902
X3 4270.050 1314.464 3.248511 0.0029
X4 0.359675 0.117148 3.070274 0.0046
R-squared 0.999383 Mean dependent var 9264.011
Adjusted R-squared 0.999298 S.D. dependent var 3827.446
S.E. of regression 101.3827 Akaike info criterion 12.21073
Sum squared resid 298074.8 Schwarz criterion 12.43520
Log likelihood -202.5825 F-statistic 11751.06
Durbin-Watson stat 0.555252 Prob(F-statistic) 0.000000
拟合方程为:
i= -10552.42+4879.92X1+1917.691X2+4270.50X3+0.359675X4
t= (-8.165) (3.7101) (1.7531) (3.2485)(3.0703)
R2=0.999383 2=0.999298 F=11751.06
Sum squared resid 298074.8
统计检验-多重共线性
从分析的数据来看,容易发现t检验还比较理想,β2 β3 β4 β5均为正值具有经济意义,在α取0.05时只有x2的t值不够显著;f统计量很大,说明解释变量对被解释变量的解释是显著的。另外残差平方和太大,可能变量间存在共线性,因此需要检验模型是否存在多重共线性的问题。
用Eviews得到相关系数矩阵
X1 X2 X3 X4
X1 1.000000 0.996976 0.844648 0.992582
X2 0.996976 1.000000 0.880265 0.996354
X3 0.844648 0.880265 1.000000 0.885829
X4 0.992582 0.996354 0.885829 1.000000
析了一下各个变量之间的相关系数,发现X1 和X2之间的相关系数达到了0.995737,相关程度很高,同时X2和X3之间的相关系数也达到了0.844648。从实际经济意义上说,这三者之间存在着相互替代性,说明模型的设定具有多重共线性,需要对模型进行修订。
经过对各个解释变量的分析,我们发现固定电话用户数、移动电话用户数、互联网用户数这三个解释变量相关性很大,且都属于通信装置,相互间有较大的替代性。于是决定尝试将这3个解释变变量相加成为新的解释变量记为X123。这样将原来的模型调整为:
Yi=β1+β2X123i+β3X4i+ ui(其中ui为随机误差项,服从正态分布)
再次拟合:
Dependent Variable: Y
Method: Least Squares
Date: 06/14/05 Time: 11:52
Sample (adjusted): 2001M12 2004M09
Included observations: 34 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C -9268.190 558.4492 -16.59630 0.0000
X123 3261.226 217.2569 15.01092 0.0000
X4 0.347181 0.115524 3.005269 0.0052
R-squared 0.999338 Mean dependent var 9264.011
Adjusted R-squared 0.999296 S.D. dependent var 3827.446
S.E. of regression 101.5703 Akaike info criterion 12.16348
Sum squared resid 319812.1 Schwarz criterion 12.29815
Log likelihood -203.7791 F-statistic 23414.32
Durbin-Watson stat 0.495369 Prob(F-statistic) 0.000000
拟合方程为:i= -9268.190+3261.226X123i+0.347181X4i
t= (-16.59630) (15.01092) (3.005269)
R2=0.999338 2=0.999296 F=23414.32
Sum squared resid=319812.1
异方差的检验,用WHITE检验作出的结果如下:
White Heteroskedasticity Test:
F-statistic 4.144353 Probability 0.008922
Obs*R-squared 12.36648 Probability 0.014824
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/14/05 Time: 14:34
Sample (adjusted): 2001M12 2004M09
Included observations: 34 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 105531.8 289136.1 0.364990 0.7178
X123 -43664.89 155576.7 -0.280665 0.7810
X123^2 4234.262 16376.52 0.258557 0.7978
X4 0.559926 42.43575 0.013195 0.9896
X4^2 0.000357 0.004935 0.072327 0.9428
R-squared 0.363720 Mean dependent var 9406.239
Adjusted R-squared 0.275957 S.D. dependent var 15224.98
S.E. of regression 12955.04 Akaike info criterion 21.91141
Sum squared resid 4.87E+09 Schwarz criterion 22.13588
Log likelihood -367.4940 F-statistic 4.144353
Durbin-Watson stat 1.404210 Prob(F-statistic) 0.008922
查χ2分布表,给定α=0.01,自由度为5,得临界值χ20.05(5)=15.0863,而 Obs*R-squared=12.36648<15.0863,所以模型中随机误差u的异方差性不明显
为了保险起见,我们用ARCH检验进行复查
ARCH Test:
F-statistic 1.792614 Probability 0.172363
Obs*R-squared 5.148988 Probability 0.161207
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/14/05 Time: 21:39
Sample (adjusted): 2002M03 2004M09
Included observations: 31 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 7053.058 3866.644 1.824078 0.0792
RESID^2(-1) 0.593010 0.265720 2.231708 0.0341
RESID^2(-2) -0.015077 0.286630 -0.052600 0.9584
RESID^2(-3) -0.210498 0.280125 -0.751441 0.4589
R-squared 0.166096 Mean dependent var 10106.28
Adjusted R-squared 0.073440 S.D. dependent var 15787.23
S.E. of regression 15196.47 Akaike info criterion 22.21543
Sum squared resid 6.24E+09 Schwarz criterion 22.40046
Log likelihood -340.3391 F-statistic 1.792614
Durbin-Watson stat 1.556831 Prob(F-statistic) 0.172363
同样的异方差性不明显。
自相关的检验
由于DW=0.495369,给定显著水平α=0.5,查Durbin-Watson表,n=34,k`=2,得下限临界值dL=1.333,因为DW统计量为0.495368<dL,所以随机误差项存在正的一阶自相关。
自相关的修正
由dw=0.495369 ρ=1-dw/2=0.7523155。利用广义差分法。
定义DY=Y-0.7523155*Y(-1)
DX123=X123-0.7523155*X123(-1)
DX4=X4-0.7523155*X4(-1)
然后进行参数估计,结果为
Dependent Variable: DY
Method: Least Squares
Date: 06/14/05 Time: 22:46
Sample (adjusted): 2002M01 2004M09
Included observations: 33 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C -2568.718 138.1116 -18.59887 0.0000
DX123 3630.988 187.9921 19.31457 0.0000
DX4 0.181301 0.093191 1.945477 0.0611
R-squared 0.995458 Mean dependent var 2626.024
Adjusted R-squared 0.995155 S.D. dependent var 956.1398
S.E. of regression 66.55126 Akaike info criterion 11.32033
Sum squared resid 132872.1 Schwarz criterion 11.45638
Log likelihood -183.7854 F-statistic 3287.557
Durbin-Watson stat 1.313646 Prob(F-statistic) 0.000000
估计式:
DY=-2568.718+3630.988DX123+0.181301DX4
t= (-18.59887) (19.31457) ( 1.945477)
R2=0.995458 DW=1.313646
虽然DW=1.313646仍然小于DL=1.333,存在正自相关,但是已经得到明显的改变。且异方差性的检验也能通过,即异方差不明显。
模型解释
模型DY=-2568.718+3630.988DX123+0.181301DX4
反映了电信累计收入相对固定、移动电话及互联网用户总数和电信固定资产投入二者的增长速度。
从现实意义来说,电信装置及电信电信投资完成额的增长率是影响电信收入增长的主要因素。而电信装置系数3630.988又远远大于电信固定资产完成额的系数0.181301。从而要求我们进一步认识到发展固定、移动电话及互联网普及率对电信收入的重要性。
结合当前情况,过去几年是我国电信业大发展时期,电信收入平均每年增长约23%。电话用户总数与移动电话总数迅速增长,并在2001年超过美国,跃居世界第一。但是,过去的高增长并不必然带来明天的高增长,在2000年和2001年,我国电信收入已经呈现出稍高于GDP的中速增长态势。 我国电信业发展水平已相当于人均GDP为我国2.5倍的国家。我国的电信收入占GDP之比例已高居世界前列。一般电信收入占GDP的比例是大致一定的,因此我国电信收入占GDP的比例继续快速提高的余地已十分有限。预计我国电信收入占GDP的比例从长期看也仍然有继续增长的空间。我国GDP增长率预期约为7%—7.5%,估计我国未来电信收入的平均增长率最高可以达到GDP增长率与电信收入超额增长率两者相叠加的水平,也就是年增长15%。但我国电信业发展较为超前,再有电信市场正面临继续的资费调整、电信业务同质与异质的竞争、运营商之间加剧的竞争以及由此引发的价格战,估计未来我国电信收入的长期平均增长率将低于这个水平。电信收入高增长时期已过去。在电信收入无法大幅度增长的情况下,迅速增长的电话普及率必然造成ARPU下降,,无论是通过提升电信服务质量,还是提供更多更好的内容服务,有限增长的总收入使得提升ARPU(所谓ARPU就是每用户平均收入(ARPU-Average Revenue Per User)。
ARPU注重的是一个时间段内运营商从每个用户所得到的利润。很明显,高端的用户越多,ARPU越高。在这个时间段,从运营商的运营情况来看,A R P U值高说明利润高,这段时间效益好。)的难度大大加大。 现实中部分新业务的增长率极高,但是基数太低,起不到拉动电信业整体增长的作用。例如给国内电信运营商带来意外惊喜的SMS(短消息)业务,2001年的业务收入也不过19.2亿元(C CID 数据)。还有带给人们神奇幻想的数据通信业务,在我国2001年的业务收入不及140亿元,尚不到电信总收入的4%(信息产业部数据),即使发展迅速,由于基数太低,几年以内的总量都将十分有限,无法指望以此带动电信业快速发展。
由于电信收入无法实现高增长,我国电信运营商如果继续连续进行大规模投资,将无法收回投资。我国电信运营业的投资一直保持在高水平,2000年度我国电信投资占到电信收入的72.3 %,而世界平均水平为21.9 %。在2001年度,我国电信投资/电信收入的比例高达78.6 %(依据CCID数据),这样高的投资比例是不可能维持的。 审视我国过去数年的电信业投资,会看到存在投资过度迹象,见图3。一个时期电信投资比重高,有时是建设周期因素,不可以简单归结为电信泡沫,但是如果继续很高的高投资水平,就会偏离经济效益的区域。
通过此模型的建立,可以对电信业务收入的增长指明方向,既然电信业固定投资增长空间较小,只有通过增长电信装置,或者说通过电信业务的使用普及率的增长来达到电信业务收入提高的目的。