2018.03.05
今天状态不佳,主要是瞌睡的缘故,无论如何中午都应该休息,即便解了头发。
今天的工作:
1. 写日志
2. 内推同学
3. 抓取数据分析逾期突然升高这部分人的特性,我把问题转换成了找IV最大的问题,因为我的分析和实践都证明这两个问题是等价的,但是IV和画出的bad rate chart看起来相比好坏两组比较分布更为明显。还有一种图是类似于weka那种,y在自变量每个level上的分布情况,其实这种图就类似于我的br_chart,而且br chart更直观,y在每个level上的分布情况,只有每个level的count相等时比较容易看出来,否则不如br chart
4. 看了下从业务上还3期,是否存在某种套路,未找到有用的信息
5. 最后就是逐步抓取变量分析呈现,这里涉及到一些seaborn的画图方法,图例等等
今天的工作:
1. 写日志
2. 内推同学
3. 抓取数据分析逾期突然升高这部分人的特性,我把问题转换成了找IV最大的问题,因为我的分析和实践都证明这两个问题是等价的,但是IV和画出的bad rate chart看起来相比好坏两组比较分布更为明显。还有一种图是类似于weka那种,y在自变量每个level上的分布情况,其实这种图就类似于我的br_chart,而且br chart更直观,y在每个level上的分布情况,只有每个level的count相等时比较容易看出来,否则不如br chart
4. 看了下从业务上还3期,是否存在某种套路,未找到有用的信息
5. 最后就是逐步抓取变量分析呈现,这里涉及到一些seaborn的画图方法,图例等等
留言
張貼留言