2017总结
2017的年已经过完,放假期间尽情吃喝娱乐,还没来得及写17年的总结和18年的计划!在这里对2017年进行一个全方位的总结!2017年发生了很多事情,有些改变很重要!也取得了一定的成绩,但是远远不够!
按时间先记个流水账吧。
全年春节回来就是部署新版模型,这是我第一次尝试评分卡之外的方法,用了时下流行的GBDT,当时对这个算法的原理和sklearn的实现都一定的研究,而且还用了一个画图的工具以及其python对应module,绘制了每一颗树的图片,得到了一些结论。当时也是才开始公司买的平台,我把所有的代码都移植到了该平台。2017年的情人节好像吃的是金妈烤肉。当时由于算法本身有一定overfit,一个关键点是没对最小叶子节点样本数进行控制,出现了严重的多头情况,而且事后也证明多头非常影响逾期,所以当时在领导的建议下,加了多头的直接拒绝规则,记得那个时候同事K还在,他根据业务提出了自己理解的多头次数。当时出了一个某苏某江的CASE,我把其加入黑名单,记得还花了一个周6下午来加班,尝试找到这些人的一个pattern,其实瞎忙活了半天,没有什么收获,后来某省的张某市也被加入了黑名单,这些案件都是运营方面的报告,并未从数据上获知,期间我也在维护其他合作产品的风控,同期的生活中,我媳妇开始调理身体,某个周末去了大学城吃烤全羊,去了我表姐的房子参观,二月到三月同事L和同事O相继离职,是战斗力不错的两位同事,那个时候团队内部离职氛围都比较浓。当时模型方面的策略,在领导的指示下,把地区分了很多组,不同的组有不同cutoff,多一个decile或少一个decile。当时还发现了一个很不错的变量,在网时长,这个变量暂时成了拒绝规则。2月-4月我记得我身体还出现一个状况,就是咳嗽不止,原因我怀疑有可能是因为我晚上回家的时候跑步造成,好在最后还是康复了,不是什么大问题!所以健康非常重要!3月末由于前面提到的离职情绪高涨,还去了看了下机会,某南滨路的公司有够low的,后来我表哥引荐去了某家银行看机会,对方倒是很赏识,同期我姐听闻我考虑新机会,也帮我内推蚂蚁,哦,当时的剧情是这样的,我去了某银行看机会,对方给的数据相当不错,而且给得很果断,说清明后给回复,我清明后就决定前往,然后紧急休了这边的婚假,婚假期间主要就是玩WOW,大米开车开得不亦乐乎,然后清理电脑,我回来没隔几天就递交辞呈,那个时候已经是4月中旬,我坦诚相见,表明了是待遇方面问题,那个时候领导就与我谈话,后来我再三考虑,反水把银行拒了,这应该是我去年最明智的决定,我现在觉得平时的工作和学习就是一个量变的积累过程,能让自己发生质变的只有在这些十字路口的选择问题,所谓会玩不如会选,我决定留下后,蚂蚁那边被拒,正好,安心在重庆造人。4月末5月初,合作产品快速扩张,相关的改动也比较频繁。我开始着手修改一个开源的IV计算工具包,决定在那个基础上开发自己的评分卡建模框架(这是17年的一个成就,后来在联合建模中大展拳脚),当时我也在想如何团结本地圈子资源,如何去招揽人才(这一点我做得不好,一直没有什么实质性进展,当时想得很美好,每周开个什么论坛之类的,让做这行的彼此都认识,这一点上我17年一点进展都没有)。劳动节去了古城阆中,参加婚礼,6月的时候来了很多新人,开始做建模宽表的建设,6月的时候还有一个和jd的合作机会,需要对一批jd的客户进行审核,我采用了jd的一些数据组成经验规则,6月末决策引擎解耦,后来我就专注于自有产品,因为自有产品难度最大,也是希望在这个产品上做出一些成绩,6月25号左右蛇儿结婚去台湾玩了几天,非常难忘的旅行,台湾不错。6月7月左右开发了v7,这个模型也是我17年的一个成就,后来证明效果不错,应该是到差不多V7上线我才完成所有其他产品的交接,7月还来一个实习生,这算是我带的第一个人,她帮我做了很多分析,有些很有挑战和开创性,对了6月的时候就有一个实习生,可是没干多久就走了,后来陆续对v7加入滚动变量,多维度的拒绝规则,改进v7,建立v7.1。7月末还有一个重要的事情,就是我开始着手做数据竞赛,以前一直就看看,从那个时候起,终于开干,我第一个比赛就是zillow,当时也花了很多时间在这个比赛上,但是突破比较大的,还是论坛上借鉴别人的方法,我自己也做了很多尝试,但是很多都失败了,在这个比赛中我也首次接触了一些工业级的GBDT实现,xgboost和lightgbm,以及后期的catboost,最后靠着一些ensemble,拿到top 6%,只获得铜牌,其实对于首次比赛取得这个成绩也不错了,但是这个成绩背后我独创的部分比较少,8月我记得是TI,然后老婆怀孕了,平均2周就要去医院检查。9月对未来有了更大的目标,希望去有一些大厂的经历,最后能到sv晃晃,那个时候我开始记单词,其实这个习惯很好,利用各种碎片时间记单词,甚至回家和老婆是英文对话,但是最后记住的是否有限,但是这个习惯真的挺不错的。国庆节去了广州和深圳,就是去看看那边的氛围,当时由于是秋天去的,也并未感到这两个地方的优势,旅途疲惫,我没注意老婆的身体,出现了一些流产的迹象,10月回来加入2阶段模型,11月末的时候有一个重大变化是大领导离职,其实对我一直提携照顾,我也很感激。11月还有一个很重要的事情,我花了极大精力参加jdd的比赛,而且放弃了wow来参加这个比赛(当时其实也是wow 7.3拖太久游戏内容有限,AFK气氛高涨),赛程一个月的时间,可以说我穷尽了毕生所学,最后差不多也top 6%的成绩,但是不好看的地方是提交的人数很少,所以没kaggle好看,从成绩上,但是确实是高手如云,而且国内比赛交流少,全靠自己的真本事,那段时间真是不眠不休,花了很多时间在这个事情上,最后几天搞得有点懈怠了,确实绞尽脑汁了,找不到更好的办法。同时家里面也在考虑买房的事情,我完成了这个比赛,也开始加入看房,觉得还是要自己看比较放心,我最后决定还是要在核心地段买房,机缘巧合入手保利天汇。1月的大事就是出差深圳,这次也是对我建模技术的一个考验,前期有一定的压力,那边天气很好,非常适合我,我整个人的身体状态都更好,很暖和的地方!2月花了大概一周的时间来review之前jdd的优秀方案!好像是进入1月开始,我背单词的习惯就坚持不好了,1月中旬回归了wow。整年下来的话,似乎都少一个锻炼在里面,依稀记得夏天的时候做过一下keep,然后就很少有运动时间了,每次下定决心,开始运动,可是起步都感觉好难。运动应该是17年做得最差的地方。
以上差不多就是我的2017吧,发生了很多大事,怀孕、置业、工作上有收获,一版效果尚可的模型,一个日趋成熟的框架,两次数据竞赛top 6%的成绩,去了新地方旅行(北海/深圳/广州/台湾),夫妻间也有很多争吵,但是后来都一一化解,生活还是向好的方面发展!加油!努力!
留言
張貼留言