value_counts()新参数

 Series.value_counts(normalize=Falsesort=Trueascending=Falsebins=Nonedropna=True)


1.默认value_counts是不显示NaN的,但是获得NaN的数量很重要,dropna=False进行调整

2.可以获得频率normalize = True,获得频率就不能获得频数,只有复用value_counts,一次normalize=False,另一次normalize=True,然后concat在一起

3.bins可以对连续变量分箱,根据观察是等宽分箱,这个分箱可以参考,然后在用pd.cut分箱

4.sort按频数排序,默认倒排

留言

熱門文章