seaborn比较两个分布、seaborn图例、barplot、violinplot、drop_duplicates

1. seaborn把两个直方图画在一起,只需要把两幅图指定相同的ax对象便可
先用fig, ax1 = plt.subplots(figsize=(12,9))返回fig对象和ax对象
再sns.distplot(x1, ax=ax1, label='good')
sns.distplot(x2, ax=ax1, label='bad')
ax1.legend()
plt.show()即可把两个直方图画在同一幅图中而且可以很容易比较分布,因为是概率密度图

2. 设置图例的方法就是sns.distplot中设置label参数,后面需要ax1.legend()才可显示出图例

3. 柱状图barplot是y是counts,好久没用差点弄错了,x是label,y是对应的counts

4. 小提琴图,忘了叫什么名字,我居然想搜索琵琶图,sns.violinplot,我开始在同一把小提琴左右两边呈现不同的分布,我想多了,忘记这个图所展示的内容了,这个图实际上就是箱线图的改进,中间还是展示的分位数,但是两边就是核密度函数,两边的分布是对称的,一般来说violinplot,x轴是一个变量的几个level,然后对应几把小提琴,就是y值在该level上的分布,一般用法是sns,violinplot(x='col1',y='col2',data=df),或者sns.violinplot(x=df['col1'],y=df['col2'])

5. df.drop_duplicates(inplace=True),这个默认就是全部distinct,Oracle也可以distinct全部,SELECT  distinct * FROM table ,distinct用法不能小觑,我还需要虚心学习!


留言

熱門文章