为什么不maximum AUC作为objective function

很多比赛评判指标是AUC,我不禁想问为什么不直接使用一个maximum AUC的函数作为objective function,经过调查发现,AUC的函数是不可微的,没办法求最优解。
历史上有些人以AUC为目标函数,仅仅是找到局部最优解,或全局最优解的近似,没办法求全局最优解,而且AT&T Labs的研究者做了实验,写了一篇论文叫做《AUC Optimization vs. Error Rate Minimization》,其中有几个发现:
1.在一个固定的error rate水平下,有一个平均AUC和方差,这里应该是不同算法达到的平均error rate
2.这个平均AUC是classification accuracy的单调递增函数
3.有一个叫rankboost的算法,在满足某个条件时可以求得全局最优AUC?还是说更好的AUC,没读太懂?条件是不均匀分布和相对高的error rate
4.一般来说,那些求局部AUC最优的算法或者求全局最优AUC近似解的算法,最后得到的AUC相比于以minimize error rate为目标的算法,求得的AUC并没有显著的更好

留言

熱門文章