logistic regression参数估计

偏统计的package对于lr的实现,往往输出结果有系数估计、standard error、检验统计量、p-value,这些值具体是怎么求的?
系数估计方法(求法)主要有随机梯度下降、牛顿法(损失函数一阶导为0,牛顿法迭代求根,迭代公式中出现二阶导H海森矩阵);
standard error求法:海森矩阵的逆就是系数的协方差矩阵,对角线就是系数方差,平方根得到标准差,回归系数标准差就是标准误(这里留下待解决的两个问题:为什么海森矩阵的逆矩阵是系数的协方差矩阵,为什么回归系数的标准差就是标准误?20220112回答:就类比于抽样均值的标准差就是标准误,估计系数视为类似均值的统计量,其标准差就是标准误)
统计量:可以采用Z(标准正态分布),也可以采用wald卡方分布(自由度为1的卡方分布),也就是Z的平方,检验的H0是,系数等于0,系数服从渐进正态分布,(系数-0)/标准误就是Z统计量,双侧检验,卡方统计量就是Z的平方,右侧检验,结果都是一样的
p-value:p-value对应到统计量的分布,z就是双侧积分,卡方是右侧积分

留言

熱門文章