2021年10月kaggle所用算法调研

在2021年10月观察了过去完结的3页比赛,大概是近2年的比赛,现在kaggle比赛表格数据的比赛并不多,表格数据比赛的参与人数一般是最多的,大概在4000人左右,一共就4个左右表格数据比赛,现在kaggle比赛类型非常丰富,包含CV、NLP、音频、体育赛事预测等等,表格数据的比赛GBDT类算法和NN类算法差不多55开或者64开,NN类算法基本要依靠ad-hoc的网络结构,和特征工程一样,都需要创造性,对于表格类数据,GBDT类算法(XGB/LGB/CB)仍然是大杀器。另外 Tabnet除了有1个比赛作为冠军方案的一小部分,有点效果,其它比赛上并未能崭露头角,tabnet不是首选。

一些我记录下来的比赛及对应冠军方案:

Jane Street:
ad-hoc的NN + xgb

IEEE-CIS Fraud Detection:
lgb/xgb/cat
NN效果不好

留言

熱門文章