2018.04.27
-10:23:日志+取消黑名单地域+专利领域沟通+新专利审核接受
-11:45:kaggle解决内存问题
-15:50:专利审核
-19:00:scorecard重构
-22:15:kaggle
scorecard经过不断调试,终于发现了问题所在,花了不少时间。
kaggle上效率偏低,首先不要想到用全部数据训练,用了全部也不等于说成绩好,抽样就行!现在节省内存的手段大致有dataframe存储的时候用更小的dtype,训练的时候会了增加训练速度,调高学习率,减少CV份数,有个人提到用lgb训练的时候,要用np.array,我目前本身也是用的array。
-11:45:kaggle解决内存问题
-15:50:专利审核
-19:00:scorecard重构
-22:15:kaggle
scorecard经过不断调试,终于发现了问题所在,花了不少时间。
kaggle上效率偏低,首先不要想到用全部数据训练,用了全部也不等于说成绩好,抽样就行!现在节省内存的手段大致有dataframe存储的时候用更小的dtype,训练的时候会了增加训练速度,调高学习率,减少CV份数,有个人提到用lgb训练的时候,要用np.array,我目前本身也是用的array。
留言
張貼留言