2018.07.11

开始具体着手进行RI的建模实践,但是我发现其实我完全可以用去年上半年的贷款来进行建模,因为当时的模型是GBDT,存在过拟合和自变量不准确的情况,后续只是用规则卡了多头,放进来的样本,确实也特别坏,所以可以认为是最接近总体的样本。所以我甚至可以直接用这部分样本来作一个新的模型,关于时效性,只是说说而已,我认为影响也并不大,人云亦云。这部分样本有最准确的y,足够的表现期。卡了多头看不到后续的情况,但是可以想象多头后续很差,可以考虑手动调整。这部分样本接近总体,有没有办法更接近?RI?我觉得不用作了,偏差不太多。那我升级模型完全可以先就用这个样本来完成。关于多头的绝对数值受环境影响增加,问题也不大,这样相当于更保守,没有问题,好人变少,在增加的情况下,仍然是低多头,那才是真好人。关于KYC的数据,我也尝试加入了模型,各种组合下来,提升很微弱,本身数据就是衍生过一次的,非原始数据feature engineering并不好完成,我是不准备去做feature engineering了,价值太小。那这样的话,就可以敲定了,我只需要一个变量!
做好自己的事,把握好自己的节奏,无问西东,少去和别人扯些废话!
还是那句话,节奏不要乱,无论现在面对的生活多么多样,去按照食谱去吃,去锻炼,每天做应该做的事情,执行力!

留言

熱門文章