通过lift判断不同模型优劣
有人问我是否可以通过lift判断不同模型优劣。
这里lift还是默认cumulative lift。我目前的结论是:lift和ROC一样,可以通过曲线下面积来比较不同模型的优劣。
同起点的情况:
以上是5个不同模型每10%的lift,第一个10%都是相同起点出发,曲线下面积越大越好,更早地发现了所有坏人,5个不同模型的各个grade情况如下:
lift1:
lift2:
lift3:
lift4:
lift5:
不同起点,中间存在交叉的情况
lift6:
lift6和lift1存在交叉如下:
这种情况依然可以用曲线下面积来衡量。
注:lift chart有个问题,它不像ROC那样,左边是封口的,这个左边的起点,必须定一个,第一个点可以横坐标是5%,也可以上面一样是10%,如果定太小,可能那最差x%样本没有统计意义。
另外,gain chart也是同理的,我目前看也可以用曲线下面积来衡量
6和1的gain交叉图:
留言
張貼留言