excel表格_excel函数公式大全_execl从入门到精通
什么是回归分析的置信区间?用Excel函数计算置信区间的3个步骤2024-03-05 21:29:06
许栩原创专栏《从入门到高手:线性回归分析详解》第9章,总体回归、置信度、置信区间及其计算方法。
多元回归方程求解后,我们分别确认了回归方程的精度和进行了回归方程的显著性验证,接下来,需要计算置信区间。
置信区间是回归分析的一个重要概念,但是,将回归分析应用到需求预测时,并不强求引入置信区间,也就是说,用回归分析做需求预测时,可以不进行置信区间的计算,而直接进行后续的预测步骤。所以,从这一点来说,大家可以跳过本章,直接进入专栏的第10章,用线性回归分析进行预测。
不过,我们做回归分析,非常有必要懂得相关置信区间的概念、逻辑和计算方法。所以,本章,我还是对此做些基础的介绍。(本专栏总目录如下图。)
置信区间。
置信区间(Confidence interval)是指由样本统计量所构造的总体参数的估计区间。【引自百科定义】
因数据极为庞大,不管是回归分析,还是统计本身,我们都不可能去统计和分析全部数据,统计学上一般采取的做法是,用样本去估计总体,也就是用局部去估计全部。
因为样本、局部毕竟是总体中的一部分,所以,用样本估算的总体存在一定的不可靠性,为了量化这种不可靠性,统计上一般以“一定的范围”来表示,这个“一定的范围”就是置信区间。
举个例子,天气预报(一种典型的预测),也是用样本估算的总体,因总体存在一定的不可靠性,所以气象台发布气温时,一般播报多少度到多少度之间,比如明天气温在20℃~30℃之间,这个20℃~30℃之间,就是置信区间。
回归分析的置信区间,可以简单地理解为,我们最终的预测结果,不是一个确定的值,而是一个区间范围。即,预测出来的结果在某个数以下,某个数以下,这两个数之间就是置信区间。
比如回归火锅店,当未来某天气温3度,打99折时,最终的预测结果,销售额在4471元至5333元之间,这个4471元至5333元之间,就是置信区间。
置信度。
上一章已经讲到了置信度,置信度可以粗暴地理解为对回归模型运行结果有把握的程度。
比如上面说的天气预测,对“明天气温在20℃~30℃之间”这个预测结果有多大的把握呢?或者说“明天气温在20℃~30℃之间”这个结果的可信程度有多大呢?量化“把握”与“可信程度”的指标就是置信度。
置信度一般用百分比来表示,比如气象预测人员对“明天气温在20℃~30℃之间”有90%的把握,或者说明天气温有90%的可能在20℃~30℃之间,这个把握,这个可能,这个90%,就是置信度。
需要强调的一点是,置信度并不是在求出置信区间后判断出来的。实际上,置信度是在求解置信区间之前,由预测人员(分析人员)自己“决定”的,你采用不同的的置信度,会带来不同的置信区间。
购买专栏解锁剩余50%
标签: 最终预测值excel