tweedie回归

tweedie回归是一种广义线性回归,用于yi是tweedie分布的情况。
sklearn有tweedie回归。
from sklearn.linear_model import TweedieRegressor
clf = TweedieRegressor(power=1.5,alpha=0,link='auto')
重要的参数有power参数,决定了具体的分布,alpha是正则项系数,link函数是广义线性模型中的把负无穷到正无穷的value映射到合适范围的函数,tweedie回归中只要power > 0都是用的log link,log link在这里就是exp,e^z,z就是线性部分,exp保证了最后的value是大于0的。
Tweedie的loss function形如这样:
第一部分是每个yi的损失求和,第二部分L2正则,这里有点错误,2应该是上标,2-范数本身右下角2可以省略。
Unit Deviance d(yi,yi_hat),根据power参数不同而不同。

μ即yi_hat。
优化损失函数,得到系数。
model有一个score方法,输出的是D2,D2 = 1-loss(y_hat,y)/loss(y_bar,y)。

TweedieRegressor(power=0,alpha=0,link='auto'),特殊情况power = 0的时候,Tweedie Regressor变成OLS线性回归,link = 'identity',其它情况下,link = 'log'。

留言

熱門文章