在此公式中,Σ后面的是指(因变量的值—因变量的预测值)的平方。使用这种方法来估计b$0和b$1得值,我们可以通过对X和Y的观察拟合一条线,从而最好地解释Y对于任何特定X值所取得值。
注意,我们在回归模型中观察的并不是总体参数值b0和b1。我们所观察的是b$0和b$1,它们是总体参数值的估计值。因此,预测必须基于参数的估计值,而检验也必须基于与假设参数值相关的估计值。
下面我们来看一个例子,假设我们要估计六个发达国家的年通货膨胀率(因变量)与货币供应量年增长率(自变量)之间的回归关系。下表显示了六个国家(n = 6)从1980年到2016年的货币供应量年均增长率和年均通货膨胀率。
下图给出了使用线性回归的直观案例。该图展示了一个散点图,上表中每个国家的数据都作为一个点进行了标记,然后我们通过以下公式进行估计得出线性回归的结果:
长期通货膨胀率= b0 + b1(货币供应量的长期增长率)+ε。
六个数据点中,每个点到拟合回归线的垂直距离是回归残差,它是因变量的实际值与由回归方程得出的因变量预测值之间的差。线性回归通过对公式1中的系数b$0和b$1进行估计,以使垂直距离的平方和最小。经过估计得出的回归方程为:长期通胀= –0.0008 + 0.3339(长期货币供应量增长率)。
根据此回归方程,如果某一国家的长期货币供应量增长率为0,则该国家的长期通货膨胀率预计为–0.08%。一个国家的长期货币供给增长率每增加1个百分点(例如,从3%增至4%),则长期通货膨胀率预计将增加0.3339个百分点。在这种包含一个自变量的回归中,斜率系数等于Cov(Y,X)/ Var(X)。下表显示了如何从已知数据中计算斜率系数。将各个国家的平均货币供应量观察结果表示为Xi,将各个国家的年平均通货膨胀率记录为Yi。国家下边的两列显示了斜率系数的两个计算要素:样本协方差和X的样本方差。
Cov(Y,X) = 0.0007577Var (X) = 0.0022691 Cov(Y,X)/Var (X) = 0.0007577/0.0022691 b$1= 0.3339 由上图所示,从1980年到2016年,这六个国家的货币供应量长期平均增长率为9.16%,长期通货膨胀率的平均值为2.98%。在线性回归中,拟合的回归线穿过对应于因变量和自变量均值的点。
因为点(9.16,2.98)位于回归线
上,所以我们可以用以下公式求出截距:
b$0 = - 0.0298 – 0.3339 (0.0916) = 0.0008
通常,分析师可以使用excel或统计软件上的数据分析功能来进行线性回归分析。
在之后,我们将讨论如何使用回归残差来对回归模型中的不确定性进行量化。
文/边际实验室,转载请务必注明出处