python查看重复记录具体情况

python pandas dataframe找出重复的对,这个在数据探索中常常会用到。
group_dict = df.groupby(by=cols).groups
group_dict的key是groupby的subset的重复记录,后面是个list,是重复记录的索引
for k,v in group_dict.items():
    print(k)
    print(len(v))
可以输出每种重复记录对应的条数

留言

熱門文章