通过lift判断不同模型优劣

有人问我是否可以通过lift判断不同模型优劣。
这里lift还是默认cumulative lift。
我目前的结论是:lift和ROC一样,可以通过曲线下面积来比较不同模型的优劣。

同起点的情况:


以上是5个不同模型每10%的lift,第一个10%都是相同起点出发,曲线下面积越大越好,更早地发现了所有坏人,5个不同模型的各个grade情况如下:

lift1:

lift2:

lift3:

lift4:

lift5:


不同起点,中间存在交叉的情况
lift6:

lift6和lift1存在交叉如下:

这种情况依然可以用曲线下面积来衡量。

注:lift chart有个问题,它不像ROC那样,左边是封口的,这个左边的起点,必须定一个,第一个点可以横坐标是5%,也可以上面一样是10%,如果定太小,可能那最差x%样本没有统计意义。

另外,gain chart也是同理的,我目前看也可以用曲线下面积来衡量
6和1的gain交叉图:




留言

熱門文章