linux换行 pandas not in vim wq pandas复杂筛选不赋值到copy上
已经过去5天了,分数没进展,但是试错方面尝试了一些奇葩的思路,对于算法有了更深入的理解,感觉没有谁比算法更懂训练和测试的目标,目标就是rmse最低,这个就是全局的,要考虑很多0,也要考虑很多有值的样本点,所以下一步的方法就是标准回归三步走!强化这个套路!就相当于拼基本功!同时有一定学习成本!
把这两天新的知识点,回顾一下
1. linux下换行\r\n,windows下换行\n
2. pandas类似于SQL not in的筛选方法, df[-df['uid'].isin(list)]
3. vim保存wq
4. 遇到一个筛选的难点,筛选的操作是先要排序,然后isin,选取最前面的53902个的某字段赋值为0,老是赋值到copy上去,不知道如何筛选,最后我分了两步,先取53902的uid,然后再isin这个uid集合,可见,先选择列,也可以用其他字段进行筛选
uid0 = df_sub[df_sub['uid'].isin(set_uSl91011)][:53902]['uid'].values
df_sub['pred'][df_sub['uid'].isin(uid0)] = 0
如果是先筛选出df,再选择列
df_sub[df_sub['uid'].isin(uid0)]['pred'] = 0只能赋值到copy上
一次性的赋值,我还需要研究一下
比赛方面,墙都撞了,回归正路,加油!
把这两天新的知识点,回顾一下
1. linux下换行\r\n,windows下换行\n
2. pandas类似于SQL not in的筛选方法, df[-df['uid'].isin(list)]
3. vim保存wq
4. 遇到一个筛选的难点,筛选的操作是先要排序,然后isin,选取最前面的53902个的某字段赋值为0,老是赋值到copy上去,不知道如何筛选,最后我分了两步,先取53902的uid,然后再isin这个uid集合,可见,先选择列,也可以用其他字段进行筛选
uid0 = df_sub[df_sub['uid'].isin(set_uSl91011)][:53902]['uid'].values
df_sub['pred'][df_sub['uid'].isin(uid0)] = 0
如果是先筛选出df,再选择列
df_sub[df_sub['uid'].isin(uid0)]['pred'] = 0只能赋值到copy上
一次性的赋值,我还需要研究一下
比赛方面,墙都撞了,回归正路,加油!
留言
張貼留言