CNN衍生变量实验大致流程和问题

我还不知道如何正确使用conv1d,我现在还是用的conv2d,只是把filter改成形如3*1的形式,然后解决二分类预测相关的一些设置,sigmoid做激活,只输出一个probability,最后的dense就是1个神经元,sigmoid做激活,loss用binary_crossentropy,也就是logistic regression的损失函数,还有就是现在不能用正确率做metrics,应该用auc,但是Keras没有现成的auc metric,需要自己通过回调函数,在epoch end的时候输出,计算得到auc,(这里我突然冒出一个问题,每次后向传播是用全部examples还是batch_size部分,应该是batch_size部分,因为如果是全部,但是全部的并没有参与前向传播,所以参数不能更新,所以就是batch部分求导,这里还要重温一下随机梯度下降,以及随机梯度下降做优化算法的NN),early stopping和最优epoch模型保存都要通过回调函数实现,没有内置的CV,CV的实现方法应该是我以前手动写的ensemble model的CV过程,自己分成5份,循环4份training,1份testing,求出平均AUC等,接下来就是输出第一个layer的weights,去计算各个线性组合变量的 IV,找出IV大的并且可解释的

留言

熱門文章