代码实现基于DeepCTR,只做了简单数据预处理,采用的是基本特征(离散特征:{'userid', 'feedid', 'authorid', 'bgm_song_id', 'bgm_singer_id'},连续特征:{'videoplayseconds'}),单个任务逐个预测,大家可以尝试改进原有的模块,并尝试新的模型和新的建模方法。 baseline纯为学习和参考,有什么做的不对的地方,还请大佬们批评和指正😄
模型:DeepFM
参数: batch_size: 512
optim: Adagrad
num_epochs: 5
learning_rate: 0.1
我的线下验证集评价指标还没有改成和官网一致的方法,所以参考意义不大,需要大家重写评估方法
线上:
weight_uauc | read_comment | like | click_avatar | forward |
---|---|---|---|---|
0.640712 | 0.624132 | 0.61151 | 0.705983 | 0.664097 |
Guo H, Tang R, Ye Y, et al. Deepfm: a factorization-machine based neural network for ctr prediction[J]. arXiv preprint arXiv:1703.04247, 2017.