一、加权最小二乘法
运用OLS方法估计过程中,我们选用权数wt=1/|et|。权数生成过程如下,在图52所示的情况下,在工作文件中点击Object→Generate Series...,在弹出的窗口中,在Enter Equation处输入w=1/@abs(resid)。
在工作文件中点击Quick→Estimate Equation,在弹出的对话框中输入Y C X,如图510所示。
图510
在图510中点击Options选项,选中Weighted LS/TSLS复选框,在Weight框中输入w,如图511所示。
图511
点击确定,即可得到加权最小二乘法的结果,如图512所示。
图512
由图512中的数据,得到模型的估计结果:
Y∧=415.6603+0.729026X
(3.55)(32.5)
R2=0.9999R2=0.9999D.W.=2.3678
F=1056.477RSS=106856.0
可以看出,常数项的t统计量的值有了显著的改进。
下面检验是否经加权的回归的模型已不存在异方差性。
记e≈2为加权回归后模型的残差估计的平方和。在图512中,点击View→Residual Tests→White Heteroskedasticity(no cross terms),进入White检验,经过估计出现White检验结果,如图513所示。
图513
由图513中的数据,得到:
e≈2=6196.481-0.165323X+0.0000048X2
(0.525)(-0.050)(0.023)
R2=0.003821
White统计量
nR2=0.07642
,其所对应的伴随概率为
P=0.967983
,因此在5%的显著性水平下,不能拒绝同方差的假设。
二、异方差稳健性标准误方法
在图52中,点击Estimate按钮,出现Spection窗口(见图514),点击Option按钮,在出现的Estimation Options窗口中,选择Heteroskedasticity选项,并选择默认的White选项(见图515),点击确定按钮退回到Equation Spection窗口(见图514),再点击确定按钮,即得到如图516所示的结果。
图514
图515
图516
可以看出,估计的参数与普通最小二乘法的结果相同,只是由于参数的标准差得到了修正,从而使得t检验值与普通最小二乘法的结果不同。
本章小结
1. 当回归模型中随机误差项的方差不是常数,即
Var(μi)=σ2i≠σ2(常数)时,称随机误差项的方差的非齐次性或为异方差性,实际经济关系中,异方差现象是十分常见的。
2. 一般经验告诉我们,对于采用横截面数据作样本的经济计量研究中,由于不同样本点上解释变量以外的其他因素的差异较大,往往会存在异方差性。采用时序资料作样本的经济计量研究中,异方差现象较轻一些,但也可能存在。
3.当模型不能满足齐次方差假设时,参数OLS估计量是非有效的,并且对OLS估计量方差的估计是有偏的。因而,普通最小二乘法是不适用的。
4. 戈德菲尔特—匡特检验法、安斯卡姆伯—雷姆塞检验、怀特检验、戈里瑟检验等方法是检验异方差性的常见方法。
思考与练习
1. 由表1中给出消费Y与收入X的数据,试根据所给数据资料完成以下问题:
(1) 估计回归模型Y=β1+β2X+u中的参数β1和β2,并写出样本回归模型。
(2) 试用Goldfeld??Quandt法和White法检验模型的异方差性。
表1消费Y与收入X单位:元
YXYXYX
558015222095140
65100144210108145
7085175245113150
80110180260110160
79120135190125165
84115140205115180
98130178265130185
95140191270135190
90125137230120200
7590189250140205
741055580140210
1101607085152220
1131507590140225
12516565100137230
10814574105145240
11518080110175245
14022584115189250
12020079120180260
14524090125178265
13018598130191270
2. 表2中给出了1985年我国北方几个省市农业总产值、农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:
(1) 试建立我国北方地区农业产出线性模型。
(2) 选用适当的方法检验模型中是否存在异方差。
表2
地区
农业总产值农业劳动力灌溉面积化肥用量户均固定农机动力
(亿元)(万人)(万公顷)(万吨)资产(元)(万马力)
北京19.6490.133.847.5394.3435.3
天津14.495.234.953.9567.5450.7
河北149.91639.0357.2692.4706.892712.6
山西55.07562.6107.931.4856.371118.5
内蒙古60.85462.996.4915.41282.81641.7
辽宁87.48588.972.461.6844.741129.6
吉林73.81399.769.6336.92576.81647.6
黑龙江104.51425.367.9525.81237.161305.8
山东276.552365.6456.55152.35812.023127.9
河南200.022557.5318.99127.9754.782134.5
陕西68.18884.2117.936.1607.41764
新疆49.12256.1260.4615.11143.67523.3
3. 表3中的数据是美国1988年研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)。试根据资料建立一个回归模型,运用Glejser方法和White方法检验异方差。
表3单位:百万美元
工业群体销售量XR&D费用Y利润Z
容器与包装6375.362.5185.1
非银行业金融11626.492.91569.5
服务行业14655.1178.3276.8
金属与采矿21869.2258.42828.1
住房与建筑26408.3494.7225.9
一般制造业32405.610833751.9
休闲娱乐35107.71620.62884.1
纸张与林木产品40295.4421.74645.7
食品70761.6509.25036.4
卫生保健80552.86620.113869.9
续表
工业群体销售量XR&D费用Y利润Z
宇航952943918.64487.8
消费者用品101314.31595.310278.9
电器与电子产品116141.36107.58787.3
化工产品122315.74454.116438.8
五金141649.93163.99761.4
办公设备与电算机175025.813210.719774.5
燃料230614.51703.822626.6
汽车2935439528.218415.4
4. 由表4中给出的收入和住房支出样本数据,建立住房支出模型。
表4收入和住房支出样本数据
住房支出收入住房支出收入
1.85
25
25
25
2.15
310
3.210
3.510
3.510
3.610
4.215
4.215
4.515
4.815
515
4.820
520
5.720
620
6.220
假设模型为Yi=β1+β2Xi+ui,其中Y为住房支出,X为收入。试求解下列问题:
(1) 用OLS求参数的估计值、标准差、拟合优度。
(2) 用Goldfeld??Quandt方法检验异方差(假设分组时不去掉任何样本值)。
5. 表5给出的是1998年我国重要制造业销售收入与销售利润的数据资料:
表51998年我国重要制造业销售收入与销售利润
行业名称销售收入销售利润行业名称销售收入销售利润
食品加工业187.253180.44医药制造业238.711264.10
食品制造业111.421119.88化学纤维制造81.57779.46
续表
行业名称销售收入销售利润行业名称销售收入销售利润
饮料制造业205.421489.89橡胶制品业77.84692.08
烟草加工业183.871328.59塑料制品业144.341345.00
纺织业316.793862.90非金属矿制品339.262866.14
服装制造业157.701779.10黑色金属冶炼367.473868.28
皮革羽绒制品81.731081.77有色金属冶炼144.291535.16
木材加工业35.67443.74金属制品业201.421948.12
家具制造业31.06226.78普通机械制造354.692351.68
造纸及纸制品134.401124.94专用设备制造238.161714.73
印刷业90.12499.83交通运输设备511.944011.53
文教体育用品54.40504.44电子机械制造409.833286.15
石油加工业194.452363.80电子通讯设备508.154499.19
化学原料制品502.614195.22仪器仪表设备72.46663.68
试完成以下问题:
(1) 求销售利润随销售收入的样本回归函数,并对模型进行经济意义检验和统计检验。
(2) 分别用图形法、Glejser方法、White方法检验模型是否存在异方差。
6. 表6所给资料为1978年至2000年四川省农村人均纯收入X和人均生活费支出Y的数据。
表6四川省农村人均纯收入和人均生活费支出单位:元/人
时间农村人均
纯收入X农村人均生活费
支出Y时间农村人均
纯收入X农村人均生活费
支出Y
1978127.1120.3
1979155.9142.1
1980187.9159.5
1981220.98184.0
1982255.96208.23
1983258.39231.12
1984286.76251.83
1985315.07276.25
1986337.94310.92
1987369.46348.32
1988448.85426.47
1989494.07473.59
1990557.76509.16
1991590.21552.39
1992634.31569.46
1993698.27647.43
1994946.33904.28
19951158.291092.91
19961459.091358.03
19971680.691440.48
续表
时间农村人均
纯收入X农村人均生活费
支出Y时间农村人均
纯收入X农村人均生活费
支出Y
19981789.171440.77
19991843.471426.06
20001903.601485.34
数据来源:《四川统计年鉴》2001年
(1) 求农村人均生活费支出对人均纯收入的样本回归函数,并对模型进行经济意义检验和统计检验。
(2) 选用适当的方法检验模型中是否存在异方差。
第6章序列相关性的检验及修正
第6章序列相关性的检验及修正
【实验目的】
1. 掌握序列相关性模型的检验方法与处理方法;
2. 掌握序列相关性模型的修正方法。
【实验内容】
中国1980—2007年全社会固定资产投资总额X与工业总产值Y的统计资料,如表61所示。
表61中国1980—2007年全社会固定资产投资总额X与工业总产值Y单位:亿元
年份全社会固定
资产投资(X)工业
增加值(Y)年份全社会固定
资产投资(X)工业
增加值(Y)
1980910.91996.5199417042.119480.7
19819612048.4199520019.324950.6
19821230.42162.3199622913.529447.6
19831430.12375.6199724941.132921.4
19841832.92789.0199828406.234018.4
19852543.23448.7199929854.735861.5
19863120.63967.0200032917.740033.6
19873791.74585.8200137213.543580.6
19884753.85777.2200243499.947431.3
19894410.46484.0200355566.654945.5
199045176858.0200470477.465210.0
19915594.58087.1200588773.677230.8
19928080.110284.52006109998.291310.9
199313072.314188.02007137323.9107367.2
试问:
(1) 当设定模型为
lnYt=β0+β1lnXt+μt
时,是否存在序列相关性?
(2) 若按一阶自相关假设μt=ρμt-1+ε1,试用广义最小二乘法估计原模型。
(3) 采用差分形式X*t=Xt-Xt-1与Y*t=Yt-Yt-1作为新数据,估计模型Y*t=α0+α1X*tυt,该模型是否存在序列相关?
【实验步骤】
在经济系统中,经济变量前后期之间很可能有关联,使得随机误差项不能满足无自相关性的假设。本案例将探讨随机误差项不满足无自相关性古典假定的参数估计问题,着重讨论自相关性模型的图形法检验、DW检验与广义最小二乘估计和广义差分法。