2018.09.20
昨天因为上午打车的问题,在社会上和别人发生纠纷,所以来到公司有点晚了,上午有些走神,一直在用社交媒体和朋友们分享,下午下班也比较早。
昨日主要是完成了,跟踪监控分析,其中涉及到一些思考,还有p-value对于考虑更极端情况这点的理解!
建模时候的自变量分布,到后来进件时候的自变量分布,由于建模的时候用的是放款的观测,所以两个分布之间是存在差异的,这个时候我们可以按照不同的分布求出一个期望Z值,两个Z值的差就是期望Z值的变化程度,这个时候我们假定分布形状不变,相当于说分布整体向一个方向平移,这个时候就可以求出,预期的通过率,但是这个时候如果已经是进件了,我们完全可以直接计算出目前的通过率。而处于建模阶段要估计通过率,就是用当时的进件样本来计算便可,但某个变量是放款后才拥有,像这个变量如果我们知道和其他变量并无相关性,我们可以按照放款集合的分布,随机分配值给进件样本,然后进行计算,逻辑上讲是没毛病的,但是我没实践过,按照分布去计算均值变化的方法,就是假定不一定是靠谱,我实践的结果是建模是一个分布,但是进件score后是一个分布,所以分布在变化,所以我感觉把观测不到的变量随机分配更好,而且这个比例可以进行一些调整,还有就是会不会存在相关性?和其他变量存在相关性的话,分配就不会是随机分配,就更复杂了,所以如果按照随机,估出来应该是比较乐观的。
p-value方面,我查了下资料,也和人讨论了下,暂时还没有领悟。
晚上去吃了饭后回去比较晚了,节奏比较乱,也没有锻炼了,在家锻炼,难度还是比较大,为什么会睡晚了呢?上厕所上了很久,吃这种东西就是有个问题,容易拉肚子,拉肚子就是耽误事,然后去洗澡的时间也比较晚,主要还是自己的问题,少吃烧烤/火锅/串串就会避免这种情况,去洗澡比较晚是自己执行力的问题!加油!节奏不要乱!按原计划,周六周日动起来!
昨日主要是完成了,跟踪监控分析,其中涉及到一些思考,还有p-value对于考虑更极端情况这点的理解!
建模时候的自变量分布,到后来进件时候的自变量分布,由于建模的时候用的是放款的观测,所以两个分布之间是存在差异的,这个时候我们可以按照不同的分布求出一个期望Z值,两个Z值的差就是期望Z值的变化程度,这个时候我们假定分布形状不变,相当于说分布整体向一个方向平移,这个时候就可以求出,预期的通过率,但是这个时候如果已经是进件了,我们完全可以直接计算出目前的通过率。而处于建模阶段要估计通过率,就是用当时的进件样本来计算便可,但某个变量是放款后才拥有,像这个变量如果我们知道和其他变量并无相关性,我们可以按照放款集合的分布,随机分配值给进件样本,然后进行计算,逻辑上讲是没毛病的,但是我没实践过,按照分布去计算均值变化的方法,就是假定不一定是靠谱,我实践的结果是建模是一个分布,但是进件score后是一个分布,所以分布在变化,所以我感觉把观测不到的变量随机分配更好,而且这个比例可以进行一些调整,还有就是会不会存在相关性?和其他变量存在相关性的话,分配就不会是随机分配,就更复杂了,所以如果按照随机,估出来应该是比较乐观的。
p-value方面,我查了下资料,也和人讨论了下,暂时还没有领悟。
晚上去吃了饭后回去比较晚了,节奏比较乱,也没有锻炼了,在家锻炼,难度还是比较大,为什么会睡晚了呢?上厕所上了很久,吃这种东西就是有个问题,容易拉肚子,拉肚子就是耽误事,然后去洗澡的时间也比较晚,主要还是自己的问题,少吃烧烤/火锅/串串就会避免这种情况,去洗澡比较晚是自己执行力的问题!加油!节奏不要乱!按原计划,周六周日动起来!
留言
張貼留言