2018.03.27

今天下午睡了觉,3点过的时候状态反而不好,原因不明,有可能是晚上没休息好,晚上严格12点前睡觉,一分钟都不要耽误, 执行力拿出来!

今天的工作主要还是想弄明白为什么中期逾期升高,上午去破除了一个假设,看看是不是因为7月过后首期很快还款,使得首期逾期很低,并不是,因为7月前就开始了这个测试,而且7月前还款日间隔很短的逾期也很高,也顺道得出了一个结论,首期逾期与首期还款和放款日的间隔是相关,这个间隔越长风险越高

下午实在困得不行,吹了下B

然后学些了一个英语单词 intent 名词同intention 意图目的 adj 坚决做某事 be intent on doing sth
,intent专注的

然后就是继续找中期逾期升高的原因,我想看看是不是因为贷款金额的缘故,这其中我顺道看了以前的baixing和jinritoutiao两个渠道,这两个渠道多头上有类似的分布,但是表现却相差很大,jinritoutiao的多头是好于目前自有产品的所有渠道,baixing类似jinritoutiao,本应该很好的,但是并不然,只能说多头是一方面,更重要的是还款能力,我认为,调查了下,暂时不能确定baixing的用户比jinritoutiao的low

晚上继续talkingdata,建了3个衍生,效果不见得好,主要是我遇到了一个问题,不知道怎么去固定catboost的CV结果,差距很大,我试了用StratifiedKFold去生成cv对象,catboost的CV函数的参数nfold写的是int型,但是也接受这个cv对象,但是还是不能固定,catboost的CV函数的seed也没用

晚上做特征工程的时候还需要个问题,就是如何在pandas上实现oracle的row_number(),已经解决!

今天工作涉及的种类还不够丰富,就只有数据挖掘应用和常规分析的练习,要接触算法,就拿nn或者catboost的原理下手,我觉得我可能要涉及到这两个算法

留言

熱門文章