excel学习库-回归分析——假设检验（Hypothesis Testing）

----------------------- 考纲要求：formulate a null and alternative hypothesis about a population value of a regression coefficient and determine the appropriate test statistic and whether the null hypothesis is rejected at a given level of significance; 会构建空假设（有些翻译成虚无假设、原假设）和备择假设，并决定在一个给定的显著性水平下选择恰当的检验统计量来决定是否应当拒绝空假设。 --------------------- 总结输出比学习输入还费时间呀~~不过总结一遍才感觉自己有学明白的感觉。假设检验是考试重点，原版书practice有很多道题都是关于怎么计算置信区间和判断是否应当拒绝H0（null hypothesis）的。一定要学会哟。感觉学好回归分析，就可以自己去股市找规律自己做回归测试，并检验自己的结果了，没准就可以应用于自己的投资分析耶~ 为什么要做假设检验？我们要确认两个金融变量之间的关系，比如资本资产定价模型中，假设股票与平均的市场风险相同，并且股票期望收益率超过无风险利率的部分与市场收益率超过无风险利率的部分相同。这里面最影响结果的关键参数就是α和β，那么我们能不能相信这个方程中的α和β两个参数，能否将样本回归出来的参数运用到总体，并按照这个方程去做预测呢？这就是假设检验要解决的问题。怎么做假设检验要做假设检验，先要确定检验的对象。在前面的描述中，我们已经做了一个关于β的假设，即我们是假设股票收益率是有市场的平均风险相同，即β=1。这就是我们关于总体的假设（null hypothesis）H0:β=1，与之相对的备择假设(alternative hypothesis)H1:β≠1。接下来要做的就是确认我们的假设对不对。有两种方法，一种是计算置信区间，如果我们的假设值落在置信区间内，那么我们不能拒绝H0，如果假设值落在置信区间外，那么我们要拒绝H0. 第二种方法是t-test。置信区间（confidence interval）置信区间的计算公式，

判断条件：假设值落在区间内，不能拒绝空假设H0；假设置落在区间外，则拒绝空假设H0。比如下面的图中(案例CFA L2)，回归方程：(R-RF)=0.0031+0.9068*(RM-RF)

在给定95%的置信度(5%的显著性水平，自由度=n-2=58的条件下，tc=2. (tc: critical t value) 置信区间的上限=0.9068+2*0.1170=1.1408 置信区间的下限=0.9068-2*0.1170=0.6728 假设值β=1落在了区间（0.6728,1.1408）里面，因此我们不能拒绝H0:β=1，即该股票具有与市场平均相同风险的假设。如果我们假设该与市场风险毫无关系，即H0:β=0，那么因为β=0并没有落在（0.6728,1.1408）区间里面，因此我们要拒绝H0:β=0，即该股票与市场风险毫无关系的假设不成立。 t-test t检验的公式如下，判断t和临界值tc（tc在给定显著性水平和自由度的情况下查表得到） t=（b1的估计-b1）/b1的估计的标准差判断条件：|t|>tc，拒绝H0。还以上面的例子，t=（0.9068-1）/0.1170=-0.7966 t的绝对值0.7966小于tc的临界值2，因此不能拒绝H0:β=1的假设。与置信区间方法得出的结论是一样的。同样，如果我们假设H0:β=0，则 t=（0.9068-0）/0.1170=7.7504,大于tc的临界值2，因此要拒绝β=0的假设。在Excel中做回归分析时，系统默认的假设斜率和截距=0，因此我们可以看到图中最后一列beta的t-Statistic的值为7.7504，和我们手工计算的一样。什么是显著性水平、自由度在前面提到tc临界值的时候有主要到是要给定显著性水平和自由度的概念。显著性水平（significance level ）是估计总体参数落在某一区间内，可能犯错误的概率，用α表示，也就是说我们设定的假设客观上是真的，但是被我们错误的拒绝了，这在统计学上被称为第I类错误（Type I error）。α=0.05，可以这么理解，这事我认为是假的，但是有5%的可能性是真的，被我误判了。在回归软件中，会运行出p-value，p-value是拒绝H0的最小的显著性水平。如果p-value比较大，比如p-value=0.4，那么就意味着在该回归中，我有40%的概率将本该为真的事情判断为假的了，那这样的结果可能不是我们能接受的。通常情况下，p-value<0.05，是比较能接受的。要计算临界值tc，除了显著性水平外，还需要知道自由度，在相同的显著性水平下，自由度越高，临界值越低。在t-test中，自由度=样本总数(n)-参数数量(2)。怎么得到临界值（critical t value:tc）临界值除了查表外，在excel中有公式可以直接计算。 TINV函数用途：返回作为概率和自由度函数的学生氏t分布的t值。语法：TINV(probability，degrees_freedom) 参数：Probability为对应于双尾学生氏-t分布的概率，Degrees_freedom为分布的自由度。实例：公式“=TINV(0.05，58)”返回2.002。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

excel学习库

excel表格_excel函数公式大全_execl从入门到精通

回归分析——假设检验（Hypothesis Testing）2024-04-11 18:50:36