2019.10.29
9:50-10:44:rsi自己造轮子,昨日小结
10:45-11:19:vendor资料查看
11:19-12:00:rsi
13:37-18:30:建模探索 关于交叉验证 WOE编码 等导致 AUC虚高的问题
发现以前一直用的StratifiedKFold,现在换成了KFold,sklearn版本更新,cross_val_score、KFold等方法路径也有所变化
验证了KFold用cross_val_score跑下来,第一份就是做test得到的AUC,最后一个输出数值就是最后一份做test的输出结果
lgb的predict直接可以在原始的X_test上跑,不需要封装成dtest,是否有封装?是否有优势?
直接WOE编码比较容易过拟合
还有关于CV和validation set的思考需要整理
10:45-11:19:vendor资料查看
11:19-12:00:rsi
13:37-18:30:建模探索 关于交叉验证 WOE编码 等导致 AUC虚高的问题
发现以前一直用的StratifiedKFold,现在换成了KFold,sklearn版本更新,cross_val_score、KFold等方法路径也有所变化
验证了KFold用cross_val_score跑下来,第一份就是做test得到的AUC,最后一个输出数值就是最后一份做test的输出结果
lgb的predict直接可以在原始的X_test上跑,不需要封装成dtest,是否有封装?是否有优势?
直接WOE编码比较容易过拟合
还有关于CV和validation set的思考需要整理
留言
張貼留言