原假设带等号,备择假设不带等号

原假设都是带等号的,=/>=/<=/无差异;备择假设相应的都是不带等号的。
这是因为原假设要有等号才方便构造成出统计量,>=和<=的情况,其实还是用=去构造的检验统计量,=是一个边界,如果=都被拒绝了,那么>或<必然被拒绝。

举个具体的z检验例子:
H0:总体均值 ≥ 100,此时样本均值10,因为原假设是总体均值很大,所以更极端的情况是样本均值小于10,这个时候计算10到100的距离是8个标准误,翻译成p-value就是10左侧求积分,p-value此时和8个标准误是等价的,10到100已经是8个标准误了,对于任何大于100的数,就比8个标准误更大,p-value更小,所以用100构造的统计量都能拒绝原假设的话,任何大于100的数构造统计量均可拒绝原假设。

所以有部分资料,直接写的H0:u = u0 H1:u < u0,这种写法结合题意,应该在统计领域也是许可的。

H0或者H1确定了检验是单尾还是双尾,看往哪边走才是更极端的。

对于fisher精确检验:

H0:预防组感染率 ≥ 非预防组
H1:预防组感染率 < 非预防组
fisher精确检验不用感染率来构造检验统计量,所以不用关注临界点=,原假设确定了检验方向
预防组感染率低的方向是更极端的,把P1/P2/P3/P4/P5相加,不能拒绝原假设,没有足够证据表明预防组感染率 < 非预防组。

如果看到这个表格后,由于样本数太少,有人就声称预防组感染率不会高于非预防组,总不会疫苗还带来副作用吧?
那H0是否可以不要等号
H0:预防组感染率 > 非预防组
H1:预防组感染率 ≤ 非预防组
我觉得是可以的,这个和上面的假设检验计算出的p-value是一样的,结论其实也并不矛盾,比如样本是(4)的情况,P1+P2+P3+P4 < 0.05,两个检验都拒绝H0,接受H1,一个结论是预防组感染率显著低于,一个结论是预防组感染率不高于,但我们站在疫苗开发者的立场,会取更精确、范围更小的那个结论,我们会认为预防组感染率低于非预防组,我们设计假设检验的时候也会更倾向于第一种。

所以阶段性结论:如果要利用原假设计算统计量,原假设就需要含等号,如果不需要依赖原假设计算统计量,就可以不要等号

看一道具体的例题:


如果调查者认为,男生中表示赞成的比率不高于女生,该题如何解?
因为H0需要有等号
所以设计假设检验
H0:π1-π2 <= 0
H1:π1-π2 > 0
但是明显p1小于p2,得到Z后右侧检验,p-value铁定大于0.5,这样的假设检验什么也不能证明

但如果设计成
H0:π1-π2 > 0
H1:π1-π2 <= 0
但这样H0没有等号,无法构造检验统计量(检验统计量是H0成立的情况下得到的),这个时候把【男生中表示赞成的比率不高于女生】分解成【男生中表示赞成的比率低于女生】OR【男生中表示赞成的比率等于女生】,任何一个为真,调查者的观点就为真,对于【男生中表示赞成的比率低于女生】这个就是例题的解答,所以支持调查者的看法。
对于【男生中表示赞成的比率等于女生】
设计假设检验
H0:π1 = π2
H1:π1 ≠ π2
z统计量不变,双侧检验 p-value = 0.0418*2=0.0836,无法拒绝原假设,不能确定男生表示赞成的比率等于女生,这里是不确定,和上面的低于并不矛盾。


留言

熱門文章