1.项目基于机器学习算法,通过对单模型和融合模型计算所得的指标进行对比,实现小分子在人体内清除率指标的预测。 2.项目运行环境:Python环境、安装Jupyter Notebook 或Spyder、需要matplotlib、numpy、pandas 、sklearn安装包库 3.项目包括3个模块:数据预处理,创建模型并编译,模型训练 4.单模型训练:训练岭回归模型、随机森林模型和极端森林模型。 5. 多模型融合:回归问题最简单的模型融合方式,取加权平均对最优的两个模型进行不同权值的平均,最终输出最优的权值结果。 6. 不同模型的评价指标以rmse为指标,经过分析,融合模型得到最低的rmse,为2.698796237546118。
2023-09-20 06:59:59 10.72MB python 机器学习 算法 回归
1
随机森林特征选取代码,可应用于重要性特征选取和排序,代码运行顺畅+最后出图。可适用于工程特征选取,对各个特征进行打分,可以自己设置随机森林的树数量等等,默认为10,1000,可自己修改。最后代码有排序功能和输出为图片功能,保存为jpg,一键到底
2023-08-04 15:17:59 1KB 随机森林 软件/插件
1
1. 对应视频链接:https://www.bilibili.com/video/BV1uW4y1h7vM/?vd_source=cf212b6ac033705686666be12f69c448 2. Matlab实现随机森林算法的数据回归预测(完整源码和数据) 3. 多变量输入,单变量输出,数据回归预测 4. 评价指标包括:R2、MAE、MSE、RMSE 5. 包括拟合效果图和散点图 6. Excel数据,暂无版本限制,推荐2018B及以上版本 7. 其他代码连接:https://docs.qq.com/sheet/DRXBpdVRydFRHTXlB?tab=BB08J2&_t=1667389129635&u=96322ede66974c7097f1238bbc559fdc
2023-07-15 10:48:42 13KB matlab 随机森林 回归 深度学习
1
实验报告:https://blog.csdn.net/Amzmks/article/details/128583508 探讨了某个国家或地区电影上座人数与电影的时长、荧幕数量、分级、题材、演员和导演等指标的关系,使用Python编程语言,利用随机森林回归预测的方法分析了影响电影卖座程度的因素,预测效果较好,拟合较为准确。 jupyter notebook numpy pandas matplotlib 数据分析 数据挖掘
2023-04-28 10:59:13 212KB 机器学习 数据挖掘 随机森林 python
1
6种算法(线性回归、随机森林、支持向量机、BP神经网络、GRU、LSTM)对电力系统负荷进行预测。通过一个简单的例子。 各种算法(线性回归、随机森林、支持向量机、BP 神经网络、GRU、LSTM)用于电力系统负载预测/电力预测。
2023-04-11 12:09:30 726KB 预测模型 负荷预测 GRU LSTM
1
任务:使用机器学习相关知识完成购房贷款违约预测,给定特征字段,输出是否会发生逾期的预测。 1.2 实验要求 1.2 题目背景 随着世界经济的蓬勃发展和中国改革开放的逐渐深入,无论是企业的发展还是从人们消费观念的转变,贷款已经成为企业和个人解决经济问题的一种重要方式。随着银行各种贷款业务的推出和人们日益膨胀的需求,不良贷款也就是贷款违约的概率也随之激增。为了避免贷款违约,银行等金融机构在发放贷款时会对借款人的信用风险进行评估或打分,预测贷款违约的概率并根据结果做出是否发放贷款的判断。如何在发放贷款前有效的评价和识别借款人潜在的违约风险,是金融机构信用风险管理的基础和重要环节,用一套科学的模型和系统来判定贷款违约的风险性可以将风险最小化和利润最大化。 1.2 数据集 数据集在../dataset 目录下,train.csv 为训练集数据,包含 120000 条数据,每条数据除去 id 和结果共有 50 个特征。test.csv 为预测集数据,包含 30000 条数据等待预测。 1.2 任务描述 本任务研究如何借助非平衡数据分类的思想对银行等金融机构的购房贷款数据进行分析,并基于随机森
2023-04-06 02:22:48 8.04MB 机器学习 随机森林
1
MATLAB首先对语音进行不同的非线性自适应时频分析的去噪,然后提取MFCC、GFCC、LPCC等特征,最后通过随机森林,对音标进行分类注1:音频文件数据集;注2:一行代码自动添加文件和子文件到路径;
2023-04-03 10:29:31 4KB matlab
1
基于监测数据及机器学习算法的湖泊水质实时评价技术对当前湖泊水资源的管理、维护和保护具有重要意义。本文针对巢湖水质的类别评价,利用随机森林(Random Forest, RF)分类算法对该区域水质进行类别判定。与其他算法相比,随机森林算法有着精度高、可容忍噪声强等诸多优点。测试结果表明,当决策树的棵数ntree=300,分裂属性集中属性个数mtry=2时,在合肥湖滨监测断面水质分类准确率可达96.15%,在巢湖裕溪口监测断面水质分类准确率高达100%,该方法具有稳健性较高、实用性强、泛化性能好等特点, 能够有效进行水质评价。

1
信用评估是商业银行等机构防范风险的重要途径,为了提高信用评估的准确率,使用随机森林(RF)来建立风险评估模型。针对随机森林模型的性能与参数的选择和数据集不平衡比例密切相关,提出了一种基于随机森林的组合分类算法(KM-GA-RF)。以UCI数据库中的German数据集进行研究,通过K-means算法对标签进行类分解。而对于哪个类分成的簇数(ki)以及随机森林算法自身的参数:树数(n_estimators)、特征数(max_features),使用改进的遗传算法对其进行优化选取。实验结果表明,基于随机森林的组合优化模型与传统RF以及其他算法进行比较,RF的预测精度高于支持向量机等算法,达到0.765,而提出的组合优化模型的预测精度为0.815,提高了5%。
1
歪斜 倾斜决策树和随机森林的 Clojure 实现。 用法 执照 版权所有 :copyright: 2015 FIXME 根据 Eclipse 公共许可证分发 1.0 版或(由您选择)任何更高版本。
2023-03-12 12:01:32 18KB Clojure
1