talking data中的woe编码方法

类似于likelihood encoding,做了一个one level CV,比如数据集是6、7、8号三天的数据,7、8的woe值赋给6号,6、8号两天的woe值赋给7号,以此类推,测试集是用整个训练集的WOE值去赋。
我怀疑是woe的运算方式不太适合直接用likelihood encoding,里面的均值运算,似乎对woe不适合,所以高手的代码是这样用的,这里还需要思考一下!

留言

熱門文章