Rossmann 13th Solution相关plt新知识

昨天继续跟完了Rossmann Sales Prediction 13th Solution,跟到最后才发现,其实和我JD的问题不太一样,因为他每一个store和date就可以组成一条record,而我的问题里面没法模仿他这个模式,我需要做聚合。但是如果不深入真是不好了解这个问题是否和自己的问题类似,在跟的过程中也学习到不少没见过的新知识!肯定是赚的!把遇到的新知识再做一些记录。
1. 改变figsize,plt.rcParams['figure.figsize'] = [width,height],我以前一般用的是plt.figure(figsize=(12,9)),rcParams好像是关于图像设置的一些列参数,有点自定义的意思
2. plt.subplot(i,j,index),应该是i * j副图,第3个参数index是图的索引,索引从1开始
3. plt.minorticks_on(),启用小号的tick
4. plt.grid(True, which='both'),显示网格线,both应该是同时显示x轴和y轴的网格线
5. plt.plot(x,y,'-'),第三个参数可以设置线的类型,'-'折线,'.'散点,'r-'红色的折线
6. dict.iteritems(),这个是产生一个生成器,dict.items()直接是产生一个copy,生成器更节约空间不断next生成下一个,而copy占用更多空间,但是索引更快
7. 一种排除离群点的方法,求出偏差的绝对值,找到中位数,比中位数大多少倍,即认为是离群点,这种方法我还是第一次遇见
8. 建新的column,可以筛选赋值,比如df.loc[conditions, 'new column name'] = 1,其余没赋值到的应该全部是NaN
9. 分配工作,但是有个notebook我找了很久,要想不要找这么久,平时的文档就要分门别类,不要逞一时之快
10. 我又去查找和学习了很多其他赛题,想找到和我的赛题类似的,找到一个类似的,却没有开源的解决方案
11. 最后Insurance要截止了,赶紧去下了几个开源kernel来提交,下次这种没有时间搞的比赛就不要去参加了,何必骗自己呢?要参加比赛,就要竭尽全力去夺取好成绩!加油!

留言

熱門文章