發表文章

目前顯示的是 2月, 2018的文章

dataframe选择、df.columns.str

2018.02.28

dtype为category每个元素类型、Series按位置取数、argparse初探、17th solution review小结

2018.02.27

2018.02.26

重启运动

dataframe merge的时候有同名字段

2018计划

2017总结

2018.02.13

lightgbm参数lambda_l2\top_rate、valid_sets、lightgbm变量重要性

2018.02.12

np.setdiff1d、pd.Index.intersection、random.sample、lgb.Dataset(X,label = y,free_raw_data=False)

访问局域网中的电脑、查看组内电脑

2018.02.11

groupby后Series转list、序列类变量、 notnull()、pd.cut、groupby字段value_counts双重索引、idxmax()最大值所在索引、两个dataframe比较需要索引顺序一致

SQL的行列转置

2018.02.09

2018.02.08

apply(str)效率优于astype(str)、pivot中columns参数列重命名、df.rename、python引用传递和值传递

2018.02.07

Series.cat.categories、astype('category')、stack、pivot和stack组合用法填补缺失

2018.02.06

链式groupby、df.groupby(['uid'])和df.groupby('uid')都生成series、agg('max')生成Series agg(['max'])生成df、批量agg快速重起列明、链式merge

pandas分组找某字段max的记录transform、top2 nlargest、除数+1避免除0异常、pd.to_timedelta(int, unit='D')、相同条件筛选赋值、NaN关系运算False、pandas时间处理

groupby后sort_values、reset_index(drop=True)、时间Series.dt、pd.Timestamp等价datetime.datetime、pd.Timedelta等价datetime.timedelta、pivot中的values参数、nunique、shift、diff、total_seconds、np.nan == np.nan