判断条件:假设值落在区间内,不能拒绝空假设H0;假设置落在区间外,则拒绝空假设H0。
比如下面的图中(案例CFA L2),回归方程:(R-RF)=0.0031+0.9068*(RM-RF)
在给定95%的置信度(5%的显著性水平,自由度=n-2=58的条件下,tc=2. (tc: critical t value)
置信区间的上限=0.9068+2*0.1170=1.1408
置信区间的下限=0.9068-2*0.1170=0.6728
假设值β=1落在了区间(0.6728,1.1408)里面,因此我们不能拒绝H0:β=1,即该股票具有与市场平均相同风险的假设。
如果我们假设该与市场风险毫无关系,即H0:β=0,那么因为β=0并没有落在(0.6728,1.1408)区间里面,因此我们要拒绝H0:β=0,即该股票与市场风险毫无关系的假设不成立。
t-test
t检验的公式如下,判断t和临界值tc(tc在给定显著性水平和自由度的情况下查表得到)
t=(b1的估计-b1)/b1的估计的标准差
判断条件:|t|>tc,拒绝H0。
还以上面的例子,t=(0.9068-1)/0.1170=-0.7966
t的绝对值0.7966小于tc的临界值2,因此不能拒绝H0:β=1的假设。与置信区间方法得出的结论是一样的。
同样,如果我们假设H0:β=0,则
t=(0.9068-0)/0.1170=7.7504,大于tc的临界值2,因此要拒绝β=0的假设。
在Excel中做回归分析时,系统默认的假设斜率和截距=0,因此我们可以看到图中最后一列beta的t-Statistic的值为7.7504,和我们手工计算的一样。
什么是显著性水平、自由度
在前面提到tc临界值的时候有主要到是要给定显著性水平和自由度的概念。
显著性水平(significance level )是估计总体参数落在某一区间内,可能犯错误的概率,用α表示,也就是说我们设定的假设客观上是真的,但是被我们错误的拒绝了,这在统计学上被称为第I类错误(Type I error)。α=0.05,可以这么理解,这事我认为是假的,但是有5%的可能性是真的,被我误判了。
在回归软件中,会运行出p-value,p-value是拒绝H0的最小的显著性水平。如果p-value比较大,比如p-value=0.4,那么就意味着在该回归中,我有40%的概率将本该为真的事情判断为假的了,那这样的结果可能不是我们能接受的。通常情况下,p-value<0.05,是比较能接受的。
要计算临界值tc,除了显著性水平外,还需要知道自由度,在相同的显著性水平下,自由度越高,临界值越低。在t-test中,自由度=样本总数(n)-参数数量(2)。
怎么得到临界值(critical t value:tc)
临界值除了查表外, 在excel中有公式可以直接计算。
TINV函数
用途:返回作为概率和自由度函数的学生氏t分布的t值。
语法:TINV(probability,degrees_freedom)
参数:Probability为对应于双尾学生氏-t分布的概率,Degrees_freedom为分布的自由度。
实例:公式“=TINV(0.05,58)”返回2.002。