置信区间 标准误 z检验 t检验 卡方检验 z分布 t分布 中心极限定理 比例的区间估计、检验 两样本差异显著性
1.抽样样本均值m落在 μ-1.96SE <= m <= μ+1.96SE的概率是95%,对不等式左右移项
m-1.96SE <= μ <= m+1.96SE,也就是说总体期望落有95%的概率落在样本均值±z*SE
2.本身标准误的算法,可以反复抽样若干次,算均值的标准差(近似)
3.仅用一次抽样计算标准误:抽样样本标准差σ,样本量n,standard error SE = σ/sqrt(n),推导不知道,可以做实验模拟,还是很接近的
4.z分布就是标准正态分布,均值为0,标准差为1,t分布近似于z分布,具有自由度,随自由度增大趋近于正态分布
4.置信区间计算,样本量较小时(多少为小没有一个定论,可以30 50 100 120),t分布,较大时,z分布,同一显著性水平下α = 0.05,临界点很接近,z分布1.96,40自由度的t分布2.021。95% CI的算法是:样本均值 ± 1.96*SE
5.正态分布(t分布同理)具有可加性,在对两独立样本进行差异显著性分析时,两样本均值作差得到的统计量依然满足正态分布,这个时候可以计算这个作差统计量的置信区间,标准误要合并计算sqrt(SE1^2/n1+SE2^2/n2),比较两样本显著性,就应该看其置信区间是否包含0,如果分别看两组的置信区间,可能出现存在overlap但是作差检验显著的情况(作差检验和置信区间计算本质是一样的),因为两组标准误是独立计算,我认为应该以作差置信区间或检验为准
6.小样本抽样均值经z-score标准化后,均值抽样分布是t分布,看单样本t检验的t统计量公式就明白了,减去均值,除以标准误
7.置信区间和检验是一回事,比如就是单样本t分布和t检验,置信区间就是±多少个标准误,然后看目标值是否在置信区间中,而t检验就是先原假设相等(原假设就构造出了标准化后的概率分布,均值为0的t分布),t统计量就是标准化后,看t等于多少,置信区间的公式m-1.96SE,t统计量 (m-μ)/SE,去量纲化,如果结果>=2或者<=-2,小概率事件发生,拒绝原假设,显著,两独立样本比较同理
8.通过作差置信区间判断差异显著不显著是一方面,具体业务上,要考虑到绝对差值的大小等结合业务判断,有可能随着n的增大,本身不显著的变得显著
9.比例,比如event rate,就是均值,实际上样本是来自0-1分布的总体(n为1的二项分布),但根据中心极限定理,样本量大的时候,均值抽样分布就是正态分布,可以直接Z检验;0-1分布总体,样本量小的时候,直接t检验(不一定非要正态总体),或者用t分布算置信区间,因为我实验了样本量15的时候,仍然很像正态分布,所以不同组的bad rate可以直接用t检验
(20211027勘误,样本量大,是两个样本正负例都大于等于5就为大,不满足的要用连续校正卡方检验或者fisher精准检验,引文blog统计量计算方式也是不太对的,应该用合并p进行估计,参考《两样本 总体比例(比率)之差 检验》)
10.卡方检验是非参检验,统计里面的参就是平均数,方差之类的
11.t检验和t分布联系,z检验和z分布联系,以此类推,置信区间就是X轴的范围,积分后概率95%
12.t检验适合小样本<=30,大了就是z检验,其实也可以统一称t检验,随着自由度增加,t检验就变成了z检验
13.单样本t检验,中H0是μ=某个数,这个假设确定了t分布的参数(均值),我们据此算出统计量,得到p(假设成立下,发生这种情况及更坏情况的概率)
14.t统计量计算和z统计量是一样的,比如单样本t检验,(检验值 - 假设值)/标准误,比如某校男生身高平均173,H0:μ = 170,SE = 5,则对于比如30的小样本T-stat = (173 - 170)/5,自由度是30-1 = 29,自由度是因为这里检验的是均值,均值确定,29个数确定,必然最后个数就确定了,能自由变动的是29个数,所有自由度为29.
留言
張貼留言