excel学习库-CFA教材详解：（二级第4章）具有一个自变量的线性回归

更多CFA教材知识解读，请关注“边际实验室” 线性回归具有一个自变量的线性回归有时称为简单线性回归，该回归将两个变量之间的关系构建为一条直线。当两个变量之间的线性关系显著时，线性回归为已知一个变量（称为自变量），预测另一个变量（称为因变量）的值提供了一个简单的模型。下面我们将对线性回归进行更详细的说明。具有一个自变量的线性回归作为金融分析师，你需要了解金融或经济变量之间的关系，或者使用一个变量值来预测另一个变量的值。例如，您可能想知道10年期美国国债收益率变化对标准普尔500指数收益率（市盈率的倒数）的影响。如果这两个变量之间的关系是线性的，我们可以使用线性回归对其进行描述。线性回归允许我们使用一个变量对另一个变量进行预测，检验两个变量之间关系的假设，并对两个变量之间关系强度进行量化。我们首先介绍具有单个自变量的线性回归。因变量（表示为Y）是我们要解释的变量，自变量（表示为X）是用于解释因变量变化的变量。例如，我们尝试根据标准普尔500指数的收益（自变量）解释小板股票的收益（因变量）。或者，我们尝试用一国货币供应量增长（自变量）解释通货膨胀率（因变量）。线性回归假设因变量和自变量之间存在线性关系。以下回归方程对该关系进行了描述： Yi = b0 + b1Xi + εi, i = 1, …, n该方程式表明因变量Y等于截距b0加上斜率b1乘以自变量X加上残差ε。残差代表因变量无法由自变量解释的部分。我们将截距b0和斜率b1称为回归系数。回归分析使用两种数据类型：横截面数据和时间序列数据。横截面数据是指在相同时间段内对X和Y的许多观察值。这些观察值可能来自不同的公司、资产类别、投资基金、人员、国家或其他实体，具体取决于回归模型。例如，横截面模型可能会使用许多公司的数据来预测每股收益增长是否可以解释特定时间段内市盈率（P/E）的差异。不通过自变量对市盈率进行估计的一个方法是直接取市盈率的平均值。如果回归模型可以给出比平均P/E更准确的P/E预测结果，那么我们称自变量有助于解释P/E，因为使用自变量可以改善我们所估计的值。最后，请注意，如果我们在回归中使用横截面观测值，则通常将观测值表示为i = 1、2，…，n。时间序列数据使用来自于相同的公司、资产类别、基金、个人、国家或其他实体不同时段的观察值，具体取决于回归模型。例如，时间序列模型可能使用多年以来的月度数据来检验美国的通胀率是否决定了美国短期利率。如果我们在回归中使用时间序列数据，通常将观察结果表示为t = 1 ，2，…，T. 线性回归究竟如何估计b0和b1?？线性回归，也称为线性最小二乘法，它计算出一条与观测值最匹配的线；它选择截距b0和斜率b1的值，以使观测值和回归线之间垂直距离的平方和最小。线性回归使用下面公式中的估计参数（或拟合参数）b$0和b$1来实现最小化。

在此公式中，Σ后面的是指（因变量的值—因变量的预测值）的平方。使用这种方法来估计b$0和b$1得值，我们可以通过对X和Y的观察拟合一条线，从而最好地解释Y对于任何特定X值所取得值。注意，我们在回归模型中观察的并不是总体参数值b0和b1。我们所观察的是b$0和b$1，它们是总体参数值的估计值。因此，预测必须基于参数的估计值，而检验也必须基于与假设参数值相关的估计值。下面我们来看一个例子，假设我们要估计六个发达国家的年通货膨胀率（因变量）与货币供应量年增长率（自变量）之间的回归关系。下表显示了六个国家（n = 6）从1980年到2016年的货币供应量年均增长率和年均通货膨胀率。

下图给出了使用线性回归的直观案例。该图展示了一个散点图，上表中每个国家的数据都作为一个点进行了标记，然后我们通过以下公式进行估计得出线性回归的结果：长期通货膨胀率= b0 + b1（货币供应量的长期增长率）+ε。

六个数据点中，每个点到拟合回归线的垂直距离是回归残差，它是因变量的实际值与由回归方程得出的因变量预测值之间的差。线性回归通过对公式1中的系数b$0和b$1进行估计，以使垂直距离的平方和最小。经过估计得出的回归方程为：长期通胀= –0.0008 + 0.3339（长期货币供应量增长率）。根据此回归方程，如果某一国家的长期货币供应量增长率为0，则该国家的长期通货膨胀率预计为–0.08％。一个国家的长期货币供给增长率每增加1个百分点（例如，从3％增至4％），则长期通货膨胀率预计将增加0.3339个百分点。在这种包含一个自变量的回归中，斜率系数等于Cov（Y，X）/ Var（X）。下表显示了如何从已知数据中计算斜率系数。将各个国家的平均货币供应量观察结果表示为Xi，将各个国家的年平均通货膨胀率记录为Yi。国家下边的两列显示了斜率系数的两个计算要素：样本协方差和X的样本方差。

Cov(Y,X) = 0.0007577Var (X) = 0.0022691 Cov(Y,X)/Var (X) = 0.0007577/0.0022691 b$1= 0.3339 由上图所示，从1980年到2016年，这六个国家的货币供应量长期平均增长率为9.16％，长期通货膨胀率的平均值为2.98％。在线性回归中，拟合的回归线穿过对应于因变量和自变量均值的点。因为点（9.16，2.98）位于回归线

上，所以我们可以用以下公式求出截距： b$0 = - 0.0298 – 0.3339 (0.0916) = 0.0008 通常，分析师可以使用excel或统计软件上的数据分析功能来进行线性回归分析。在之后，我们将讨论如何使用回归残差来对回归模型中的不确定性进行量化。文/边际实验室，转载请务必注明出处

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

excel学习库

excel表格_excel函数公式大全_execl从入门到精通

CFA教材详解：（二级第4章）具有一个自变量的线性回归2024-02-22 21:08:45