2021年10月kaggle所用算法调研
在2021年10月观察了过去完结的3页比赛,大概是近2年的比赛,现在kaggle比赛表格数据的比赛并不多,表格数据比赛的参与人数一般是最多的,大概在4000人左右,一共就4个左右表格数据比赛,现在kaggle比赛类型非常丰富,包含CV、NLP、音频、体育赛事预测等等,表格数据的比赛GBDT类算法和NN类算法差不多55开或者64开,NN类算法基本要依靠ad-hoc的网络结构,和特征工程一样,都需要创造性,对于表格类数据,GBDT类算法(XGB/LGB/CB)仍然是大杀器。另外 Tabnet除了有1个比赛作为冠军方案的一小部分,有点效果,其它比赛上并未能崭露头角,tabnet不是首选。
一些我记录下来的比赛及对应冠军方案:
Jane Street:
ad-hoc的NN + xgb
IEEE-CIS Fraud Detection:
lgb/xgb/cat
NN效果不好
留言
張貼留言