我们遇到的实际问题中,则往往是涉及到几个变量或几个经济现象.许多现象之间是相互联系、相互制约的.现象之间的关系可以概括为两种类型:函数关系和相关关系.函数关系是指现象之间客观存在的,在数量上按一定法则严格确定的相互依存关系.在此种关系中,当给定某一变量的数值时,都有另一个变量的确定值与之对应,例如圆面积与半径的关系:S=πr2.而相关关系是指现象之间客观存在的,在数量上受随机因素影响,非确定性的相互依存关系.在这种关系中对应于一个变量的取值,另一个变量可能有多个数值与之对应,例如,人的身高和体重,一般的身高者体重也大,但具有同一身高的人,体重却有差异,因此身高与体重之间的关系就是相关关系.回归预测就是利用统计分析的方法,对具有相关关系的变量,根据大量的历史数据,运用数理统计方法,近似的用一个数学关系式来描述变量与变量之间相关关系,并由此从一个或几个变量的值去预测其他变量的一种方法.建立回归模型,并据以进行因果预测.建立的回归模型,不仅可以描述变量间相关关系的紧密程度和方向,还可以进行推算和预测.在回归分析中有静态回归分析和动态回归分析之别,动态回归中研究动态回归分析的问题,在分析中对自变量时间数列进行外推预测,将预测值代入回归方程,据以推算因变量数值.
回归预测的一般程序是:第一,对预测对象及其相关因素相互对应的观察值作相关图(散点图),判定其相关类型,从而确定采用何种回归模型.第二,计算相关系数,判定变量间相关关系的密切程度,如果高度相关或显著相关,则回归模型有价值,否则,就无价值.第三,当确定相关关系密切,适于回归预测,则可配合回归线,建立回归模型,确定模型中的参数.第四,对回归方程进行效果检验,效果好,则可进行预测.第五,利用回归方程进行预测.
6.3.1一元线性回归预测
一元线性回归预测(Linear regression forecast)的模型是:y=a+bx.配合回归线,建立回归方程,要求解线性模型参数值,其主要方法是最小平方法.
在回归分析中,将要预测的变量称为因变量(或被解释变量),与因变量相关的变量称为自变量(或解释变量).只有一个自变量的回归分析称为一元回归,否则称为多元回归.另外,按照变量之间的具体变动形式又有线性回归非线性回归之分.本节只介绍最基本的一元线性回归预测法.
一元线性回归预测法是指成对的两个变量数据分布上大致呈直线趋势变化时,采用适当的方法,找到两者之间特定的数学关系式,即一元线性回归模型,然后根据自变量的变化来预测因变量发展变化的方法.
只有当两个变量具有线性相关关系时,才可以用一元线性回归进行预测.如何来判断两个变量是否具有线性相关关系呢?一般来说,首先根据经济理论、有关专业知识和工作经验进行定性分析初步判断,其次可绘制散点图和计算相关系数作定量分析加以判断.
1. 散点图
散点图是统计学中的一种统计图.将两个变量分别作为坐标轴建立平面直角坐标系,在坐标系中描出所有成对数据的坐标点即可绘制散点图.例如已知有8个企业生产相同的某种产品,月产量和生产费用的资料如表63.由散点图61可知,月产量和生产费用之间存在近似的直线相关关系.
表638个企业月产量和生产费用资料
企业编号12345678
月产量(千吨)(x)1.22.03.13.85.06.17.28.0
生产费用(万元)(y)628680110115132135160
图618个企业月产量和生产费用的散点图
2. 相关系数
相关系数是说明变量之间相关关系的程度和方向的一种指标,其计算公式为
r=∑ni=1(xi-x)(yi-y)∑ni=1(xi-x)2∑ni=1(yi-y)2
其中,n为成对数据的个数,x=1n∑ni=1xi和y=1n∑ni=1yi分别为变量x和y的算术平均.通过代数推导,相关系数也可通过如下快捷公式计算:
r=n∑ni=1xiyi-∑ni=1xi∑ni=1yin∑ni=1x2i-∑ni=1xi2n∑ni=1y2i-∑ni=1yi2
相关系数介于-1和1之间,即|r|≤1.具体来说,|r|越接近于1,表示变量之间的线性相关关系越强,越接近于0,表示相关关系越弱;正值相关系数表示变量之间存在正相关,负值相关系数表示变量之间存在负相关.
为了判断时有个标准,有人提出了相关关系密切程度的等级:|r|