关于Criteo数据的FFM 尝试使用以下现场感知分解机(FFM)的实施方式来复制的结果: 数据 下载完整的数据集并将其转换为CSV格式: ./data.sh ln -s train.csv tr.csv ln -s test.csv te.csv 或者,使用微小的数据: ln -s train.tiny.csv tr.csv ln -s test.tiny.csv te.csv 用法 建立LIBFFM并预处理数据,就像: make 移至或并按照说明进行操作。 参考
2021-12-18 15:10:28 370KB hive kaggle factorization-machines ctr-prediction
1
https://www.kaggle.com/c/avazu-ctr-prediction/data 文件说明 train - 训练集。 10 天的点击数据,按时间顺序排列。 非点击和点击根据不同的策略进行子采样。 https://www.kaggle.com/c/avazu-ctr-prediction/download/train.gz 测试- 测试集。 1 天的广告用于测试您的模型预测。 https://www.kaggle.com/c/avazu-ctr-prediction/download/test.gz sampleSubmission.csv - 格式正确的样本提交文件,对应于 All-0.5 基准。 https://www.kaggle.com/c/avazu-ctr-prediction/download/sampleSubmission.gz 数据字段 i
2021-12-10 14:21:41 6KB Python
1
点击率模型 基于纯Spark MLlib的CTR预测模型,无第三方库。 实现模型 朴素贝叶斯 逻辑回归 分解机 随机森林 梯度提升决策树 GBDT + LR 神经网络 内部产品神经网络(IPNN) 外部产品神经网络(OPNN) 用法 这是一个行家项目。 Spark版本是2.3.0。 Scala版本是2.11。 在maven自动导入依赖项之后,您可以简单地运行示例函数( com.ggstar.example.ModelSelection )来训练所有CTR模型并获得所有模型之间的指标比较。 有关点击率预测的相关论文 其他资源
2021-10-20 17:07:59 57KB machine-learning scala spark ctr-prediction
1