np.setdiff1d、pd.Index.intersection、random.sample、lgb.Dataset(X,label = y,free_raw_data=False)

np.setdiff1d(ar1,ar2)求得array1中不在array2的部分。

idx1 = pd.Index([1,2,3,4])
idx2 = pd.Index([3,4,5,6])
idx1.intersection(idx2)
Index对象的intersection方法求出与另一个Index对象的交集

random模块有一个sample方法,random.sample(array-like,length),其实这里可以不用这样手工来分出训练集和验证集,不是有方法直接可以分吗?sklearn中train_test_split

lgb.Dataset(X,label = y,free_raw_data=False),有个free_raw_data,这个参数我以前没用过,看起来作用是 是否释放原始的数据



留言

熱門文章