置信区间标准误 z检验 t检验卡方检验 z分布 t分布中心极限定理比例的区间估计、检验两样本差异显著性

3月 21, 2020

置信区间标准误 z检验 t检验卡方检验 z分布 t分布中心极限定理比例的区间估计、检验两样本差异显著性

1.抽样样本均值m落在 μ-1.96SE <= m <= μ+1.96SE的概率是95%，对不等式左右移项

m-1.96SE <= μ <= m+1.96SE，也就是说总体期望落有95%的概率落在样本均值±z*SE

2.本身标准误的算法，可以反复抽样若干次，算均值的标准差(近似)

3.仅用一次抽样计算标准误：抽样样本标准差σ，样本量n，standard error SE = σ/sqrt(n)，推导不知道，可以做实验模拟，还是很接近的

4.z分布就是标准正态分布，均值为0，标准差为1，t分布近似于z分布，具有自由度，随自由度增大趋近于正态分布

4.置信区间计算，样本量较小时（多少为小没有一个定论，可以30 50 100 120），t分布，较大时，z分布，同一显著性水平下α = 0.05，临界点很接近，z分布1.96，40自由度的t分布2.021。95% CI的算法是：样本均值 ± 1.96*SE

5.正态分布（t分布同理）具有可加性，在对两独立样本进行差异显著性分析时，两样本均值作差得到的统计量依然满足正态分布，这个时候可以计算这个作差统计量的置信区间，标准误要合并计算sqrt(SE1^2/n1+SE2^2/n2)，比较两样本显著性，就应该看其置信区间是否包含0，如果分别看两组的置信区间，可能出现存在overlap但是作差检验显著的情况（作差检验和置信区间计算本质是一样的），因为两组标准误是独立计算，我认为应该以作差置信区间或检验为准

6.小样本抽样均值经z-score标准化后，均值抽样分布是t分布，看单样本t检验的t统计量公式就明白了，减去均值，除以标准误

7.置信区间和检验是一回事，比如就是单样本t分布和t检验，置信区间就是±多少个标准误，然后看目标值是否在置信区间中，而t检验就是先原假设相等（原假设就构造出了标准化后的概率分布，均值为0的t分布），t统计量就是标准化后，看t等于多少，置信区间的公式m-1.96SE，t统计量 (m-μ)/SE，去量纲化，如果结果>=2或者<=-2，小概率事件发生，拒绝原假设，显著，两独立样本比较同理

可参考https://www.sohu.com/a/213312659_489312

可参考https://www.iteye.com/blog/san-yun-2302668

8.通过作差置信区间判断差异显著不显著是一方面，具体业务上，要考虑到绝对差值的大小等结合业务判断，有可能随着n的增大，本身不显著的变得显著

参考https://www.iteye.com/blog/san-yun-2302668

9.比例，比如event rate，就是均值，实际上样本是来自0-1分布的总体（n为1的二项分布），但根据中心极限定理，样本量大的时候，均值抽样分布就是正态分布，可以直接Z检验；0-1分布总体，样本量小的时候，直接t检验（不一定非要正态总体），或者用t分布算置信区间，因为我实验了样本量15的时候，仍然很像正态分布，所以不同组的bad rate可以直接用t检验

~~参考https://blog.csdn.net/moxigandashu/article/details/51648872~~

（20211027勘误，样本量大，是两个样本正负例都大于等于5就为大，不满足的要用连续校正卡方检验或者fisher精准检验，引文blog统计量计算方式也是不太对的，应该用合并p进行估计，参考《两样本总体比例(比率)之差检验》）

10.卡方检验是非参检验，统计里面的参就是平均数，方差之类的

11.t检验和t分布联系，z检验和z分布联系，以此类推，置信区间就是X轴的范围，积分后概率95%

12.t检验适合小样本<=30，大了就是z检验，其实也可以统一称t检验，随着自由度增加，t检验就变成了z检验

13.单样本t检验，中H0是μ=某个数，这个假设确定了t分布的参数（均值），我们据此算出统计量，得到p（假设成立下，发生这种情况及更坏情况的概率）

14.t统计量计算和z统计量是一样的，比如单样本t检验，(检验值 - 假设值)/标准误，比如某校男生身高平均173，H0：μ = 170，SE = 5，则对于比如30的小样本T-stat = (173 - 170)/5，自由度是30-1 = 29，自由度是因为这里检验的是均值，均值确定，29个数确定，必然最后个数就确定了，能自由变动的是29个数，所有自由度为29.

搜尋此網誌

Silver Death

置信区间标准误 z检验 t检验卡方检验 z分布 t分布中心极限定理比例的区间估计、检验两样本差异显著性

留言

張貼留言

熱門文章

把cell从一个notebook复制到另一个notebook

python调用win32api设置窗口位置和大小

置信区间 标准误 z检验 t检验 卡方检验 z分布 t分布 中心极限定理 比例的区间估计、检验 两样本差异显著性

留言

張貼留言

熱門文章

把cell从一个notebook复制到另一个notebook

python调用win32api设置窗口位置和大小

置信区间标准误 z检验 t检验卡方检验 z分布 t分布中心极限定理比例的区间估计、检验两样本差异显著性