关于Criteo数据的FFM 尝试使用以下现场感知分解机(FFM)的实施方式来复制的结果: 数据 下载完整的数据集并将其转换为CSV格式: ./data.sh ln -s train.csv tr.csv ln -s test.csv te.csv 或者,使用微小的数据: ln -s train.tiny.csv tr.csv ln -s test.tiny.csv te.csv 用法 建立LIBFFM并预处理数据,就像: make 移至或并按照说明进行操作。 参考
2021-12-18 15:10:28 370KB hive kaggle factorization-machines ctr-prediction
1
心衰预测 分类项目可根据某些患者属性预测由于心力衰竭导致的死亡。
2021-12-16 15:32:44 412KB JupyterNotebook
1
narx的matlab代码多元多步风速预测 该呼吸包含使用多变量输入数据进行的单步和多步风速预测的实现代码。 这个想法是使用外部参数(例如温度,湿度,压力等)来预测不同层位的风速(向前迈进),而不涉及风速本身的历史数据。 使用了两种主要方法,包括各种深度学习迁移学习方法和常规神经网络模型。 数据库 风力数据库是从M2塔的获得的。 每两秒钟获取一次M2塔数据,并在不同高度(2至80 m)下测量的一分钟内取平均值。 但是,出于预测目的,我们将数据下采样到10分钟(平均)。 可以访问已处理的数据。 数据进行了分区,以将一年(2017)用于培训和验证(80%和20%),并将另一年(2018)用于测试目的。 转移学习 预训练的深度学习模型用于该实验。 该代码在中实现。 神经网络 文献中提出的几种神经网络方法已在以下方面实现:前馈神经网络(FFNN),时延神经网络(TDNN),非线性自回归外生模型(NARX)。
2021-12-16 12:33:41 3.5MB 系统开源
1
出租车票价预测 预测纽约市出租车的票价
2021-12-15 20:25:16 2KB
1
heart_disease_prediction 欢迎来到我的第三个存储库。 这次,我将分享迄今为止最详细的笔记本(用Python 3.6编写),在其中我将对有趣的数据集进行端到端分析。 里面有一些漂亮的情节和描述。 我希望您会喜欢本演练。
2021-12-15 10:15:31 401KB JupyterNotebook
1
GDP_and_Employment_Rates_Prediction:一种机器学习回归模型,使用Python中的随机森林回归来预测国家的GDP和就业率
2021-12-14 20:32:48 125KB machine-learning random-forest numpy scikit-learn
1
新浪微博互动预测 介绍 比赛的详细信息可以在找到竞争主要是分析用户在中国微博平台上发布的行为和消息,并预测每条消息的转发,评论和喜欢的次数。 该项目主要使用python和pandas。 这项比赛的第二阶段仍在进行中。 这是我为第1阶段构建的数据基准线。 设计 这是一个自行设计的数据基准线。 主要思想是模块化数据项目的流程。 用户编写方法来生成功能,其存储数据帧中大熊猫在功能的文件夹,并feature.log会自动记录所有现有的功能和它们的参数。 用户可以在Train方法中组合不同的功能并选择不同的模型,模型将存储在models文件夹中,模型的信息将存储在train.log中。 用户选择不同的功能和参数组合进行测试,结果将存储在结果文件夹中,而测试信息将存储在test.log中 笔记本文件夹中的Ipython笔记本用于播放数据,迭代地查看日志。 该代码位于weiboPredict
2021-12-11 21:15:37 31.29MB Python
1
薪水预测 预测薪水
2021-12-11 15:49:21 7KB CSS
1
https://www.kaggle.com/c/avazu-ctr-prediction/data 文件说明 train - 训练集。 10 天的点击数据,按时间顺序排列。 非点击和点击根据不同的策略进行子采样。 https://www.kaggle.com/c/avazu-ctr-prediction/download/train.gz 测试- 测试集。 1 天的广告用于测试您的模型预测。 https://www.kaggle.com/c/avazu-ctr-prediction/download/test.gz sampleSubmission.csv - 格式正确的样本提交文件,对应于 All-0.5 基准。 https://www.kaggle.com/c/avazu-ctr-prediction/download/sampleSubmission.gz 数据字段 i
2021-12-10 14:21:41 6KB Python
1
心力衰竭预测 机器学习Streamlit Web应用程序可预测由心力衰竭引起的死亡率 数据集来源 数据集来自Kaggle。 作者是Davide Chicco和Giuseppe Jurman:机器学习可以仅凭血清肌酐和射血分数来预测心力衰竭患者的生存。 BMC Medical信息学与决策制定20,16(2020)。 网络应用功能 侧边栏目录 探索数据 关于心力衰竭的信息。 使用选定的熊猫功能进行数据集探索。 用于特定列比较的多选框功能。 具有可自定义的轴和图类型的可视化区域。 预测死亡率 侧栏上的用户输入功能(复选框,单选按钮,滑块和数字输入)。 数据框基于用户输入。 结论按钮可预测死亡率。 引文数据集来源 机器学习模型随机森林分类器 预测值 年龄 贫血-红细胞或血红蛋白减少(布尔型) creatinine_phosphokinase-血液中CPK酶的水平(mcg / L)
2021-12-09 11:58:42 8KB Python
1