2019.10.29

9:50-10:44:rsi自己造轮子,昨日小结
10:45-11:19:vendor资料查看
11:19-12:00:rsi
13:37-18:30:建模探索 关于交叉验证 WOE编码 等导致 AUC虚高的问题

发现以前一直用的StratifiedKFold,现在换成了KFold,sklearn版本更新,cross_val_score、KFold等方法路径也有所变化

验证了KFold用cross_val_score跑下来,第一份就是做test得到的AUC,最后一个输出数值就是最后一份做test的输出结果

lgb的predict直接可以在原始的X_test上跑,不需要封装成dtest,是否有封装?是否有优势?

直接WOE编码比较容易过拟合

还有关于CV和validation set的思考需要整理

留言

熱門文章