excel学习库

excel表格_excel函数公式大全_execl从入门到精通

Excel数据分析:单样本假设检验

上一篇文章#我对假设检验进行了初步介绍,接下的文章我们将进入实战阶段,好了让我们开始吧。

01 形成单样本假设检验

某公司曾接到过无数个请求提供技术支持的热线电话。过去,平均的响应时间一直保持在至少25分钟。后来,公司更新了信息系统,并认为这将有助于缩短响应时间。因此,公司相信平均的响应时间可以缩短到25分钟以内。公司收集了一个样本,观察了44个响应时间的值,将数据整理到 Excel表格文件之中(见下图)。如果新的信息系统发挥了作用,那么,数据应当能够确认,平均响应时间不到25分钟;这定义了备择假设H1。因此,原假设和备择假设的正确表述如下: H0:母体平均响应时间≥25分钟 H1:母体平均响应时间<25分钟

02 理解假设检验中的风险

我们已经知道,样本数据可能产生巨大的变异。因此,根据样本数据得出的假设,有可能是错误的。假设检验可能导致以下四种不同结果中的一种: 1.原假设事实上是正确的,而假设检验正确地不能拒绝它。2.原假设事实上是错误的,而假设检验正确地得出这一结论。3.原假设事实上是正确的,但假设检验错误地拒绝了它(称为第一类错误)。3.原假设事实上是错误的,但假设检验错误地不能拒绝它(称为第二类错误)。犯下第一类错误的概率,也就是说P(拒绝H0 |H0正确),用α来表示,称为显著性水平。它定义了你愿意接受做出错误结论的风险,该错误结论是:当原假设事实上是正确时,认定备择假设也正确。决策者可以控制α的值,并在开始检验时选择好它。α的值常用的有0.10、0.05和0.01。 正确地不能拒绝原假设的概率,也就是说P(不能拒绝H0 | H0正确),称为置信系数,计算为1-α。如果置信系数为0.95,指的是当H0事实上正确时,我们希望在100个样本中有95个样本支持原假设,而不支持备择假设。 遗憾的是,我们无法控制第二类错误的概率,即P(无法拒绝H0 | H0错误),它用β来表示。与α不同的是,β不能事先规定,而是取决于(未知的)母体参数的正确的值。

03 举例:β如何取决于真正的母体平均值

考虑上文例子中的以下假设:H0:母体平均响应时间≥25分钟vs H1:母体平均响应时间<25分钟 假设我们进行两次抽样,在一次抽取的样本中,真正的平均响应时间比如说为15分钟,而在另一种抽取的样本中,真正平均响应时间比如说为24分钟。那么,我们可以预期,在第一种情况下错误地认为原假设正确的概率,比第二种情况低得多。如果真正的平均值为15分钟,那么,样本的平均值很可能比25小很多,使我们拒绝H0。如果真正的平均值为24分钟,虽然它比25小,但我们有更大的概率不能拒绝H0,这是因为,由于抽样误差的存在,样本平均值大于25的可能性,比第一种情况高一些。所以,真正的平均响应时间距离假设的值越远,β就越小。 一般情况下,随着α减小,β增大,决策者必须考虑如何来权衡这些风险。这样,如果你选择的显著性水平是0.01而不是0.05,并且样本容量保持不变,那么,你可能降低了第一类错误出现的概率,但是却增大了第二类错误出现的概率。 1-β的值称为检验效能,它代表着当原假设实际上错误时,正确地拒绝原假设的概率,用P(拒绝H0 | H0错误)来表示。我们希望检验效能更高一些(同样,我们希望第二类错误出现的概率低一些),以便可以得出有效的结论。检验效能对样本容量敏感;样本容量小,通常导致1-β的值较小。通过增大样本容量,可以提高检验效能,从而更加准确地察觉到样本统计量与母体参数之间的细微差别。然而,样本容量增大,则会导致成本增加,这使得“天底下没有免费的午餐”这句俗语有了新的解释。这意味着,如果你选择了较低的显著性水平,在进行检验时,应当选择较大的样本容量来补偿。

04 选择检验统计量

下一步是收集样本数据并运用数据来得出结论。拒绝或者不能拒绝原假设的决定,基于对样本数据中检验统计量的计算。使用的检验统计量取决于假设检验的类型。不同的假设检验使用不同的检验统计量,重要的是使用正确的。正确的检验统计量通常取决于对母体的假设——比如,标准差到底是不是已知的。下列公式显示了针对平均值以及与它们相关的检验统计量的两类单样本假设检验。μ0的值是母体平均值的假设值;也就是说,在假设形成中的“常数”。

05 计算检验统计量

对于上文的例子,44位客户形成的样本,其平均响应时间为21.91分钟,样本的标准差为19.49。假设的平均值为μ0=25。你可能怀疑,为什么当样本平均值21.91明显小于25的时候,我们也必须从统计学上检验这一假设。其原因是存在抽样误差。很可能母体的平均值实际上等于或超过25,而我们只是从母体中抽取了一个平均值较小的样本,纯属幸运。因为潜在的抽样误差,如果在没有更好的统计学证据来证明,只看样本的平均值就认定公司已经达到了其目标是非常危险的做法。由于我们不知道母体标准差的值,因此,要使用的合适的检验统计量,用以下公式来计算:通过观察可以发现,该公式的分子是样本平均值(21.91)与假设的值(25)之间的距离。用它来除以标准误差,t值就代表着样本平均值距离假设值之间的标准误差的个数。在这个例子中,样本平均值比假设值25少了1.05个标准误差——如果样本平均值离假设值“太远”,那么,应当拒绝原假设。

06 得出结论

拒绝或不能拒绝的决定,基于当原假设正确时,将检验统计量的值与从检验统计量的抽样分布中的“临界值”进行对比,也基于显著性水平α的选择。检验统计量的抽样分布通常是正态分布、t分布或者其他一些众所周知的分布。 对于单尾检验,临界值是距离假设值的标准误差的个数,对于这个假设值,其超过临界值的概率为α。比如,如果α=0.05,那么我们就说,样本平均值距离假设值有那么远的机率,只有5%,而这纯粹是因为抽样误差导致的,而且,一旦这种情况发生,表明真正的母体平均值与假设的不同。 临界值将样本分布分成两部分:一个拒绝域和一个非拒绝域。如果原假设是错误的,检验统计量很可能处在拒绝域。如果它确实处在拒绝域,我们拒绝原假设。否则,我们不能拒绝它。拒绝域是选定的,以便如果H0正确时,检验统计量落入到拒绝域中的概率,就是第一类错误的概率α。 拒绝域出现在检验统计量抽样分布的尾部,并且取决于假设检验的结构,如下图所示。如果原假设的结构是=,而备择假设的结构是≠,那么,假如检验统计量要么显著地高要么显著地低,我们将拒绝H0。在这种情况下,拒绝域将出现在分布的左侧和右侧的尾部,如下图所示。这称为双尾假设检验。因为,鉴于H0正确时,检验统计量落入拒绝域的概率,也就是说,双尾的累计面积必须为α,所以,左尾和右尾的面积都为α/2。其他类型的假设检验,即规定了关系方向的检验(其中,H0或大于或小于假设值),称为单尾假设检验。在这种情况下,拒绝域只出现在分布的一个尾部(如下图所示)。为单尾检验确定正确的分布尾部来作为拒绝域,是一件容易的事。如果H1表述为<,那么,拒绝域处在左尾。如果H1表述为>,那么,拒绝域处在右尾(只要把大于号和小于号想象成箭头,它指向哪一侧,拒绝域就落在哪一侧的尾部)。 双尾检验同时有两个临界值,左尾和右尾,而单尾检验只有一个临界值,要么是左尾临界值,要么是右尾临界值。对于标准分布和分布,其平均值为0,左尾临界值是负的,右尾临界值是正的。 临界值使我们容易确定检验统计量到底有没有落入到合适的样本分布的拒绝域之中。例如,对于右尾单尾检验,如果检验统计量大于临界值,那么,决定应当是拒绝原假设。同样,对于左尾单尾检验,如果检验统计量小于临界值,那么,决定应当是拒绝原假设。对于双尾检验,如果检验统计量要么大于右侧临界值,要么小于左侧临界值,决定应当是拒绝原假设。

07 找出临界值并得出结论

对于上文的例子,如果显著性水平为0.05,那么,单尾检验的临界值是自由度为n-1的t分布的值,它提供了一个0.05的尾部面积,可以用 Excel函数T.INV(1-α,n-1)。所以,临界值为T.INV(0.95,43)=1.68.由于μ分布是对称的,其平均值为0,而且这是一个左尾单尾检验,因此,我们使用这个数值的负数(-1.68)作为临界值。将t-统计量的值与这个临界值相比较,我们发现,检验统计量没有落在临界值下方(也就是说,-1.05>-1.68),而且没有落入拒绝域之中。因此,我们不能拒绝H0,不能拒绝推断平均响应时间已经缩短到25分钟以下。上图图解了我们得出的结论。即使样本平均值小于25,但我们不能推断平均响应时间缩短到25分钟以内,这是因为存在大量的抽样误差。

08 p-值

在假设检验中,有一种替代的方法来比较检验统计量与临界值,那便是找出这样一个概率当原假设正确时,获得一个等于或更极端地大于从样本数据中得到的检验统计量的概率。这个概率通常称为p值,或者称为观察的显著水平。为了得出推断结论,将p值与选定的显著性水平α相比较;不论什么时候,只要p≤a,就拒绝原假设,否则,就不能拒绝原假设。p值使我们更容易就假设检验而形成推断。 使用p-值 对于上文的例子,用于假设检验响应时间的t统计量为-1.05。如果真正的平均值确实为25,那么,p值就是获得等于或小于-1.05的检验统计量的概率,我们可以使用Excel函数来计算p值:T.DST(-1.05,43,TRUE)=0.1498.因为p=0.1498,大于α=0.05,因此,我们不能拒绝H0。换句话讲,如果原假设是正确的话,那么,该检验统计量将等于或者小于-1.05的机率约为15%。那是相当高的概率,因此,我们难以推断真正的平均值小于25,而且,我们可以把检验统计量小于假设值这一事实只归因为样本误差,并且不拒绝原假设。

09 平均值的双尾假设检验

基本上,所有的假设检验都是类似的;只是一定要确保你选择了正确的检验统计量、临界值和拒绝域,这些取决于假设的类型。以下这个例子阐述了针对平均值的双尾假设检验。对平均值进行双尾假设检验 某旅行社在一项调查中收集到有34位受访者的年龄数据,假设旅行社希望把那些年龄接近35岁的人作为目标客户。因此,我们想检验受访者的平均年龄是否为35岁。用以检验的假设是: H0:平均年龄=35 vs H1:平均年龄≠35 经计算,样本的平均值为38.677,而样本的标准差为7.858。 我们使用t统计量:在这一案例中,样本平均值比假设的平均值35高出了2.73个标准差。然而,由于这是个双尾检验,拒绝域和决策规则都不同。对于显著性水平α,如果t统计量要么落入负临界值之下,要么落入正临界值之上,那么,我们拒绝H0。 用 Excel函数T.INV.2T(0.05,33)=2.0345。因此,临界值为±2.0345。因为t统计量没有落在这两个值之间,我们可以拒绝平均年龄为35岁的原假设(见下图)。这一检验的p值是0.010,它可以用 Excel函数 T.DIST.2T(2.73,33)来计算。因此,由于0.010≤0.05,所以我们拒绝H0。

10 对比例进行单样本检验

很多重要的商业数据,如市场份额或者及时交货的百分比,都用比例来表达。我们可以象对待平均值那样,以同样的方式来对样本的比例进行假设检验。针对比例的单样本检验的检验统计量为类似于针对平均值的检验统计量,z检验统计量显示了样本比例距离假设值有多少个标准差。这一检验统计量的抽样分布为标准正态分布。 欢迎关注,下一篇将介绍用Excel完成双样本假设检验,你的关注与点赞是我持续创作的动力,谢谢。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接