excel学习库

excel表格_excel函数公式大全_execl从入门到精通

回归分析的基础概念1:什么是变量、自变量、因变量和“哑变量”

大家好,我是许栩,欢迎来到我的专栏《从入门到高手-线性回归分析详解》,这是专栏的第一篇文章,介绍几个回归分析的基础概念:变量、自变量、因变量和“哑变量”。常用的定量预测方法包括时间序列预测法与回归分析预测法。时间序列预测法是以内生数据(也就是历史需求数据)为分析对象的预测方法,而回归分析预测法则以外生数据(或称解释性数据,比如促销)为分析对象。 定量方法中,时间序列不能利用解释性变量来塑造需求,无法识别诸如价格、广告、促销、市场或经济波动等外部因素(外生数据)或因果因素(解释性因素)带来的需求变化。 但是,价格、广告、促销、市场或经济波动等外生数据(解释性数据),在市场现实中几乎不可避免。为了解决这一问题,回归分析粉墨登场。本专栏讲解回归分析预测法,是指用于需求预测的回归分析方法。回归分析方法有很多种,但是,对于需求预测来说,一些高深的复杂回归分析技术似乎并不实用且较难落地,所以,本专栏,仅针对对需求预测来说较实用的线性回归分析进行讲解。 本专栏的两个说明。 1、尽可能减少原理性讲述。能直接用Excel函数或数据分析功能计算出结果,我不再对计算过程和原理进行讲解。 2、本专栏引用数据全部为虚拟。 本专栏的主要内容见下图。在正式讲解回归分析之前,我先用两章的篇幅讲解回归分析的几个名词和概念。 回归分析涉及到的名词和概念很多,但随着目前一些通用软件如Excel的统计与数据分析功能加强,对于回归分析应用于需求预测来说,大部分名词和概念我们并不需要了解,比如“最小二乘法”、“标准化残差”等。 但有些名词和概念是回归分析的基础,是入门级的概念,我们需要知道。比如本章讲的变量和下章要讲的相关性一、什么是变量。 回归分析需要了解的第一个概念是变量。 变量,顾名思义,就是指没有固定的值,可以变化的量,是相对于常量的一个概念。 在回归分析中,变量是指存在不同的值的各种指标。具体解释如下。 首先,变量需要有一个载体(指标)。比如销量,比如折扣,比如时间。 其次,变量是一个数量。这个数量可以体现为数值(比如销量50元),也可以体现为某一项特征(比如性别的男、女)。 再次,变量的值(即数量)是可以变化的,不是固定的。比如气温每天在变化,每天的温度值不同, 最后,变量有很多种,这个世界存在数不清的变量。回归分析就是要找出一些有用的变量,来进行分析。二、自变量与因变量。 首先,自变量和因变量都是变量。 自变量也称解释性变量,或预测变量,是指回归分析者主动操纵的变量。 因变量也称目标变量,是被测定或被记录的变量。因变量是由于自变量变动而引起变动的量。 这两个概念看起来可能有点绕,我换一种说法:自变量是“原因”,因变量是“结果”。那些表示原因的是自变量,因原因而得到的结果,就是因变量。 比如,某公司为提升销量进行一轮降价促销,这价格就是自变量,价格变动会带来销量的变化,这销量,就是因变量。 再比如,某公司进行提升销量的方式是做广告,那广告投入就是自变量,而同样,广告投入力量大小会带来不同的销量变化,销量,就是因变量。 如果还是不太理解自变量和因变量,那么,我再给一个更简单的方法:在以需求预测为目的的回归分析中,我们可以直接认为,我们需要预测的是因变量,其它一切为计算预测值而引用的变量都是自变量 比如我们以气温变化和居民空调数量来预测用电量,我们要预测的是用电量,用电量就是因变量。而为了预测用电量而采集的数据“每日温度”和“居民空调数”就是自变量。 在进行回归分析中,自变量可以有若干个,但因变量只有一个。三、什么是哑变量。 我们知道自变量和因变量,那么,哑变量是什么呢? 哑变量其实是自变量的一种,但因其特殊性,我将其单列一节讲解。 我前文说到,变量是一个数量,这个数量可以体现为数值,也可以体现为某一项特征,这种以某一特征表现的变量就是哑变量。比如性别(男女)。 哑变量,又称虚拟变量、名义变量或干预变量,是自变量中表示分类的变量或定性的变量,一般取值0和1,表示一个或多个定性特征的存在或不存在。 定性指标往往是不可测量的,无法用数值去表示,于是,哑变量应运而生。哑变量作为一个信号或特征符号参与回归分析。 比如,我们预测天气对销量的影响,晴天用1表示,不是晴天用0表示,这就是一个哑变量。性别,男的用1表示,女的用0表示,这也是哑光量。 哑变量是自变量的一种,和自变量一样,哑变量也可以有若干个。 将哑变量和其它自变量一起参与回归建模,能够增加回归模型对需求预测的效果。本章小结。 这一章,我讲解的是回归分析的基础概念之一,变量。在回归分析中,变量是指存在不同值的各种指标。 自变量是回归分析者主动操纵的变量,是一种解释性变量。因变量是由于自变量变动而引起变动的量。自变量是“原因”,因变量是“结果”。我们需要预测的是因变量,其它一切为计算预测值而引用的变量都是自变量。 哑变量是自变量的一种,是自变量中表示分类的变量或定性的变量,一般取值0和1,表示一个或多个定性特征的存在或不存在。 我是许栩,供应链从业二十年,专注于供应链计划,精于需求预测,欢迎大家关注和阅读,也欢迎大家分享、讨论、转发和收藏。 有关变量、自变量、因变量和哑变量的问题,大家可以留言提出,我将一一解答。专栏的下一节,将讲解回归分析的基础概念2,相关性与相关关系,欢迎收藏与订阅,谢谢!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接