多元回归方程。
多元回归分析,又称重回归分析,就是通过多个因素(自变量)对目标(因变量)进行预测的一种手段和方法。
多元回归分析,可以理解为有两个或两个以上自变量的回归分析。
多元回归分析自变量和因变量的关系,可以多元方程式的形式表现出来,这个多元方程式就是多元回归方程。
多元回归拥有两个或两个以上的自变量,多元线性回归方程式是y=a1x1+a2x2+…+anxn+b。多元回归方程与一元回归方程很相似,区别在于一元回归方程是一个自变量,而多元回归方程有多个自变量。(见下图)
下图式中,y为因变量,即我们要预测的目标变量,x1为自变量1,x2为自变量2,x3为自变量3,…,xn为自变量n,。
a1、a2、a3、…、an分别为x1、x2、x2、…、xn的回归系数(也叫偏回归系数),代表每个自变量对因变量影响的程度。
b为截距,为多元线性回归直线与Y轴交点的纵坐标。
纳入多元回归方程自变量的确定。
前文我说到,影响需求的因素,也就是说自变量有很多个,我们不可能也没有必要把这些自变量都纳入多元回归方程。何况这些自变量有的影响大,有的影响小,有的重要,有的不重要。这时,我们需要做出选择,需要采取办法将影响大的自变量纳入多元回归方程。
采取什么方法呢?做相关分析。即对每一个自变量和因变量做相关分析,也就是求出每一个自变量和因变量的相关系数R,然后按一定的标准,将相关系数R达到一定标准的纳入回归方程。(这里涉及到一个“多重共线性”的问题,我将在本专栏的下一章,即第六章详细讲述,本章暂不深入。)
我们可以用Excel函数CORREL计算相关系数R(详细计算方法请见本专栏第二章《回归分析的基础概念之2:确定关系与相关关系,相关系数与判定系数》)。
相关系数R达到多少才可以纳入多元回归方程,我给出如下的标准。(详见下图)
上图说明如下:
1、强相关、中相关直接纳入多元回归方程,即相关系数R比±0.5或更大(小)的自变量直接纳入多元回归方程。
2、弱相关,即相关系数在±0.3—±0.5之间的变量,可考虑纳入多元回归方程。根据其它数据情况(比如多重共线性),以及这个变量的特性及未来发展预期等情况综合考虑。
3、微弱相关或不相关,即相关系数比±0.3或更小(大)的变量,直接排除在多元回归方程之外。
下图,我给出了一个纳入多元回归方程自变量选择的实例。我仍模拟了“回归火锅店”的一组数据,下文的求解多元回归方程,也将用这个数据。(为便于讲解,我只列出了三个自变量。)
购买专栏解锁剩余51%