.5综合案例分析(1 / 1)

一、研究背景

随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。假日旅游更是有力刺激了居民消费,拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19??1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化了产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。

影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此,选取我国31个省市地区的旅游业相关数据进行定量分析,分析我国旅游业发展的影响因素。

二、模型设定

建立模型:

Y=β0+β1X1+β2X2+β3X3+β4X4+Ut

参数说明:

Y——旅游景区营业收入,万元;

X1——旅游业从业人员,人;

X2——旅游景区固定资产,万元;

X3——旅游外汇收入,万美元;

X4——城镇居民可支配收入,元。

收集到的数据,如表72所示。

表722011年全国旅游景区营业收入及相关数据(按地区分)单位:万元

地区营业收入从业人数固定资产外汇收入可支配收入

北京145249.01145466694252.3054160032903.03

天津48712.372478793529.6717555326920.86

河北182226.8779643420342.744476518292.23

山西29465.0357719121809.745671918123.87

内蒙古70313.0736264206819.126709720407.57

辽宁25665.306481646573.2727131420466.84

吉林20389.302906687827.163852817796.57

黑龙江38367.8130341137426.279176215696.18

上海194762.391106563007.4457511836230.48

江苏316051.651401541195000.6056529726340.73

浙江385976.921324591110975.2045417330970.68

安徽79562.7555840139769.0211791818606.13

福建155378.9580303151897.6936344424907.40

续表

地区营业收入从业人数固定资产外汇收入可支配收入

江西54961.664179185528.054150017494.87

山东116995.67143026327733.2925507622791.84

河南222108.3370164482005.325490318194.80

湖北104565.5862767243794.629401818373.87

湖南118180.8780615257226.710143418844.05

广东476345.502265391160675.4139061926897.48

广西66195.5549876143982.0310518818854.06

海南29081.603075970386.553761518368.95

重庆86713.6750160230124.009680620249.70

四川218624.0370756464763.525938317899.12

贵州42214.142768362415.211350716495.01

云南135897.9762679348426.0416086118575.62

西藏30406.736023462971.031296316195.56

陕西48692.1757077154529.1912950518245.23

甘肃30949.003128056684.68174014988.68

青海638.4387419851.28265915603.31

宁夏49509.861219623149.9062017578.92

新疆28993.114045152280.364651915513.62

数据来源:《中国统计年鉴2012》、《中国旅游年鉴2012》

三、参数估计

利用Eviews软件做多元线性回归分析的具体步骤如下。

1. 创建工作文件

双击Eviews图标,进入其主页。在主菜单中依次点击File→New→Workfile,出现对话框Workfile Range。本例中是截面数据,在workfile structure type中选择Unstructured/Undated,在Date range中填入observations 31,点击OK键,完成工作文件的创建。

2. 输入数据

在命令框中输入 data Y X1 X2 X3 X4, 回车出现Group窗口数据编辑框,在对应的Y X1 X2 X3 X4下输入相应数据,关闭对话框将其命名为group 01,点击OK,保存。

对数据进行存盘,点击File→Save As,出现Save As对话框,选择存入路径,并将文件命名,再点OK。

3. 参数估计

在Eviews命令框中键入LS Y C X1 X2 X3 X4,按回车键,即出现回归结果。

利用Eviews估计模型参数,最小二乘法的回归结果,如表73所示。

表73回归结果

Dependent Variable: Y

Method: Least Squares

Date: 11/14/17Time: 21:14

Sample: 1 31

Included observations: 31

CoefficientStd. Errort??StatisticProb.

C32390.8339569.490.8185810.4205

X10.6036240.3661121.6487410.1112

X20.2342650.0412185.6835830.0000

X30.0446320.0607550.7346200.4691

X4-1.9140342.098257-0.9122020.3700

R??squared0.879720Mean dependent var114619.2

Adjusted R??squared0.861215S.D. dependent var112728.1

S.E. of regression41995.55Akaike info criterion24.27520

Sum squared resid4.59E+10Schwarz criterion24.50649

Log likelihood-371.2657Hannan??Quinn criter24.35060

F??statistic47.54049Durbin??Watson stat2.007191

Prob(F??statistic)0.000000

根据表中的样本数据,模型估计结果为:

Y∧=32390.83+0.603624X1+0.234265X2

+0.044632X3-1.914034X4

(39569.49)(0.366112)(0.041218)(0.060755)(2.098257)

t=(0.818581) (1.648741) (5.683583) (0.734620) (-0.912202)

R2=0.879720R2=0.861215F=47.54049DW=2.007191

可以看出,可决系数R2=0.879720,修正的可决系数R2=0.861215。说明模型的拟合程度还可以。但是当α=0.05时,X1、X2、X4系数均不能通过检验,且X4的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。

四、模型修正

1. 检验

选中X1 X2 X3 X4数据,点击右键,选择Open→as Group,在出现的对话框中选择View→Covariance Analysis→correlation,点击OK,得到相关系数矩阵。

计算各个解释变量的相关系数,得到相关系数矩阵,如表74所示。

表74相关系数矩阵

变量X1X2X3X4

X11.0000000.8097770.8720930.659239

X20.8097771.0000000.7583220.641086

X30.8720930.7583221.0000000.716374

X40.6592390.6410860.7163741.000000

由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。

2. 多重共线性修正

采用逐步回归的办法,检验和回归多重共线性问题。分别做Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LS Y C X1,LS Y C X2,LS Y C X3,LS Y C X4,并保存,整理结果如表75所示。

表75一元回归结果

变量X1X2X3X4

参数估计值1.9782240.3151200.31694612.54525

t统计量8.63511112.474956.9224794.005547

R20.7199830.8429240.6229880.356191

R20.7103270.8375080.6099880.333991

其中,X2的方程R2最大,以X2为基础,顺次加入其他变量逐步回归。在命令窗口中依次输入:LS Y C X2 X1,LS Y C X2 X3, LS Y C X2 X4,并保存结果,整理结果如表76所示:

表76加入新变量的回归结果(一)

变量

变量X1X2X3X4R2

X2,X10.711446

(2.679575)0.230304

(5.891959)0.866053

X2,X30.258113

(7.016265)0.087950

(2.043471)0.853546

X2,X40.312045

(9.319239)0.293708

(0.143226)0.831828

经比较,新加入X1的方程R2=0.866053,改进最大,而且各个参数的t检验显著,选择保留X1,再加入其他新变量逐步回归,在命令框中依次输入:LS Y C X2 X1 X3,LS Y C X2 X1 X4,保存结果,整理结果如表77所示。

表77加入新变量的回归结果(二)

变量

变量X1X2X3X4R2

X2,X1,X30.603269

(1.652919)0.227087

(5.630196)0.024860

(0.439370)0.862078

X2,X1,X40.773017

(2.741794)0.237243

(5.833838)-1.364110

(-0.701920)0.863581

当加入X3或X4时,

R2

均没有所增加,且其参数是t检验不显著。从相关系数可以看出X3、X4与X1、X2之间相关系数较高,说明X3、X4引起了多重共线性,予以剔除。

当取α=0.05时,tα/2(n-k-1)=2.048,X1、X2的系数t检验均显著,这是最后消除多重共线性的结果。

修正多重共线性影响后的模型为:

Y∧=0.711446X1+0.230304X2

(0.265507)(0.039088)

t=(2.679575)(5.891959)

R2=0.874983R2=0.866053F=97.98460DW=1.893654

在确定模型以后,进行参数估计,如表78所示。

表78消除多重共线性后的回归结果

Dependent Variable: Y

Method: Least Squares

Date: 11/14/17Time: 21:47

Sample: 1 31

Included observations: 31

CoefficientStd. Errort??StatisticProb.

C-4316.82412795.42-0.3373730.7384

X10.7114460.2655072.6795750.0122

X20.2303040.0390885.8919590.0000

R??squared0.874983Mean dependent var114619.2

Adjusted R??squared0.866053S.D. dependent var112728.1

S.E. of regression41257.10Akaike info criterion24.18480

Sum squared resid4.77E+10Schwarz criterion24.32357

Log likelihood-371.8644Hannan??Quinn criter.24.23004

F??statistic97.98460Durbin??Watson stat1.893654

Prob(F??statistic)0.000000

五、异方差检验

在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。

1. 检验异方差

由表4.5的结果,按路径View→Residual Tests→Heteroskedasticity Tests,在出现的对话框中选择Specification:White,点击OK得到White检验结果如表79所示。

表79White检验结果

Heteroskedasticity Test: White

F??statistic3.676733Prob. F(5,25)0.0125

Obs*R??squared13.13613Prob. Chi??Square(5)0.0221

Scaled explained SS15.97891Prob. Chi??Square(5)0.0069

Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 11/14/17Time: 21:48

Sample: 1 31

Included observations: 31

CoefficientStd. Errort??StatisticProb.

C-1.10E+091.11E+09-0.9927790.3303

X1-12789.3630151.30-0.4241730.6751

X1^20.4207160.2943321.4293930.1653

X1*X2-0.1018140.083576-1.2182160.2345

X214604.525047.7012.8933010.0078

X2^2-0.0024890.008030-0.3099720.7592

R??squared0.423746Mean dependent var1.54E+09

Adjusted R??squared0.308495S.D. dependent var2.70E+09

S.E. of regression2.24E+09Akaike info criterion46.07313

Sum squared resid1.26E+20Schwarz criterion46.35068

Log likelihood-708.1335Hannan??Quinn criter.46.16360

F??statistic3.676733Durbin??Watson stat1.542170

Prob(F??statistic)0.012464

从上表可以看出,nR2=13.13613,由White检验可知,在α=0.05下,查χ2分布表,得临界值χ20.05

(5)=11.0705,比较计算的χ2统计量与临界值,因为nR2=13.13613χ20.05(5)=11.0705,所以拒绝原假设,表明模型存在异方差。

2. 异方差的修正

(1) 用WLS估计:选择权重w=1/e1^2,其中e1=resid。

在命令窗口中输入genr e1=resid,点回车键。

在消除多重共线性后的回归结果(表78的回归结果)对话框中点击Estimate→Options→Weithted LS/TSLS,并在Weight中输入1/e1^2,点确定,得到如表710所示回归结果。

表710用权数1/e1^2的回归结果

Dependent Variable: Y

Method: Least Squares

Date: 11/14/17Time: 21:49

Sample: 1 31

Included observations: 31

Weighting series: 1/E1^2

CoefficientStd. Errort??StatisticProb.

C-7074.873389.4944-18.164250.0000

X10.7882770.01369257.570990.0000

X20.2358060.000968243.67860.0000

Weighted Statistics

R??squared0.999848Mean dependent var31056.56

Adjusted R??squared0.999837S.D. dependent var171821.4

S.E. of regression4.259384Akaike info criterion5.827892

Sum squared resid507.9857Schwarz criterion5.966665

Log likelihood-87.33232Hannan??Quinn criter.5.873128

F??statistic92014.78Durbin??Watson stat1.663366

Prob(F??statistic)0.000000

Unweighted Statistics

R??squared0.871469Mean dependent var114619.2

Adjusted R??squared0.862288S.D. dependent var112728.1

S.E. of regression41832.86Sum squared resid4.90E+10

Durbin??Watson stat1.853343

(2) 修正后的White检验。

在表710的回归结果中,按路径View→Residual Tests→Heteroskedasticity Tests,在出现的对话框中选择Specification:White,点击OK得到White检验结果如表711所示。

表711修正后的White检验结果

Heteroskedasticity Test: White

F??statistic0.210748Prob. F(2,28)0.8113

Obs*R??squared0.459736Prob. Chi??Square(2)0.7946

Scaled explained SS0.595955Prob. Chi??Square(2)0.7423

Test Equation:

Dependent Variable: WGT_RESID^2

Method: Least Squares

Date: 11/15/17Time: 20:29

Sample: 1 31

Included observations: 31

Collinear test regressors dropped from specification

CoefficientStd. Errort??StatisticProb.

C17.639915.9225942.9784100.0059

WGT-256.0052728.8280-0.3512560.7280

WGT^28.26192623.571550.3505040.7286

R??squared0.014830Mean dependent var16.38664

Adjusted R??squared-0.055539S.D. dependent var29.69485

S.E. of regression30.50832Akaike info criterion9.765641

Sum squared resid26061.21Schwarz criterion9.904414

Log likelihood-148.3674Hannan??Quinn criter.9.810878

F??statistic0.210748Durbin??Watson stat2.081320

Prob(F??statistic)0.811251

从上表可知nR2=0.459736