许栩原创专栏《从入门到高手:线性回归分析详解》第四章,一元线性回归分析。
实际场景中,对需求影响的因素很多,也就是说自变量很多,很少能用单一的变量,也即一元回归分析来做好预测。回归分析在预测里的应用,主要是多元回归。但是,我们必须学会和掌握一元回归分析,因为,一元回归是多元回归的基础,我们只有学会和掌握了一元回归,才能够继续去学习和掌握多元回归。
《从入门到高手:线性回归分析详解》专栏总目录见上图。
一元线性回归方程。
线性回归,是假设因变量和自变量之间存在线性关系,线性关系可以用一元或多元线性方程式的形式表现出来,这个方程式就是线性回归方程。
一元线性回归只有一个变量,方程式是y=ax+b。(见上图)
式中,y为因变量,x为自变量。
a为回归直线的斜率,也称为回归系数。回归系数(regression coefficient)表示自变量x 对因变量y 影响程度的参数。回归系数越大(绝对值),代表自变量x 对因变量y 的影响程度越大。
回归系数与相关系数的正负方向相同,即正相关关系的回归系数为正数,表示因变量y 随着自变量x 增大而增大;负相关关系的的回归系数为负数,表示因变量y 随着自变量x 增大而减少。
b为截距。截距分为横截距和纵截距,横截距是直线与X轴交点的横坐标,纵截距是直线与Y轴交点的纵坐标。
在回归方程中,b是指的纵截距,即回归直接与Y轴交点的纵坐标(见上图)。
求解一元线性回归方程。
上图我模拟了一组数据,记录了回归火锅店冬天的气温和销售业绩。
上图中气温和销售业绩是一组数据,是一个数据集。回归分析其实就是寻找一条最能“拟合”这组数据的直线,寻找一条最佳直线。(所谓“拟合”,在回归分析中,是指找出一条穿过数据集的,并且使这组数据集上的每个数据点到直线距离最近的直线。)
这个最佳的直线就是我们需要求解的线性回归直线y=ax+b,即我们需要求出回归方程中回归系数a和截距b分别为多少。
常见的求解回归系数a和截距b(求解回归方程)的方法,一般有散点图法、最小二乘法和Excel函数求解法。前两个是从原理方面解出回归方程,后者是用Excel函数为工具解出回归方程(不管原理)。
从原理方面求解回归方程比较复杂(比如最小二乘法),而Excel函数可以非常简单解出回归方程,本专栏以基于需求预测讲回归分析,即回归分析主要是为了需求预测,我们对原理可以不用了解,只需要知道如何解出方程即可。
所以,本篇仅讲解用Excel函数求解一元线性回归方程方法。
用Excel求解线性回归方程有三种方法:LINEST函数求解、散点图功能自动求解和Excel数据分析工具求解。
1、LINEST函数求解。
购买专栏解锁剩余51%