本项目是世卫组织建立了一段时间内所有国家健康状况的数据集,其中包括预期寿命,成人死亡率等方面的统计数据。使用此数据集,探索各种变量之间的关系,通过数据集建立模型对预期寿命进行预测以及找出对预期寿命的最大影响因素是什么? 本项目主要解决以下问题: - 最初选择的各种预测因素是否真的影响预期寿命?实际影响预期寿命的预测变量有哪些? - 预期寿命值低于(<65)的国家是否应该增加其医疗保健支出以改善其平均寿命? - 婴儿和成人死亡率如何影响预期寿命? - 是否接受教育对人类寿命有何影响? - 预期寿命与饮酒是正相关还是负相关? - 人口稠密的国家的预期寿命是否有降低的趋势? 数据集:数据/探索影响预期寿命的因素/Life Expectancy Data.csv 案例来源:https://www.kaggle.com/kumarajarshi/life-expectancy-who
2023-01-31 10:55:30 2.44MB 数据挖掘 机器学习 课程设计
1
主页有解释博客,可参考 本文要解决的问题为预测问题,即给出seer提取的癌症病人数据,如A病人的患病时长,性别,年龄等信息以及他是否死亡,通过训练后,给出某个病人的信息后就可以判定他是否死亡,具有一定的现实意义。同理还有股票涨跌问题
2023-01-14 19:17:59 1.93MB python stacking 决策树 随机森林
1
针对随机森林(RF,random forest)算法的投票原则无法区分强分类器与弱分类器差异的缺陷,提出一种加权投票改进方法,在此基础上,提出一种检测 Android 恶意软件的改进随机森林分类模型(IRFCM,improved random forest classification model)。IRFCM选取AndroidManifest.xml文件中的Permission信息和Intent信息作为特征属性并进行优化选择,然后应用该模型对最终生成的特征向量进行检测分类。Weka 环境下的实验结果表明IRFCM具有较好的分类精度和分类效率。
1
统计图 条形图 柱状图 折线图 数量统计 matplotlib sklearn jupyter notebook 人工智能实验 数据集
2023-01-04 15:28:16 47KB 机器学习 随机森林 matplotlib
1
# 购房贷款违约预测 ### 数据集说明 训练集 train.csv ```python # train_data can be read as a DataFrame # for example import pandas as pd df = pd.read_csv('train.csv') print(df.iloc[0]) # list of 51 features and one label ``` 测试集 test.csv ```python # test_data can be read as a DataFrame # for example import pandas as pd df = pd.read_csv('test.csv') print(df.iloc[0]) # list of 51 features ``` 测试集标签文件 test_label.txt,格式如下 ```txt 1 0 1 1 ... ... ``` 其中训练集12万条,测试集3万条。 包括准确率计算 sklearn jupyter
2023-01-04 15:28:15 15KB 机器学习 随机森林
1
使用随机森林、SVM、线性回归等常用机器学习模型预测肺癌患病数据集的存活时长。 随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面。
2022-12-28 11:27:16 650KB 机器学习 人工智能 SVM 随机森林
1
决策树、随机森林和极度随机森林的交叉验证评分的python代码
2022-12-18 03:56:15 678B python 决策树 随机森林 开发语言
1
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:04 2.62MB 深度学习 机器学习 项目
通过jueceshu.py建立一棵决策树,再通过main.py从17个样本中每次随机抽取11个样本建立1棵决策树,一共建立3个决策树,再统计每棵决策树的预测结果,选取出现结果最多的类别为最终结果。参考了一些博客,但是他们的预测函数有点问题,不能采用自己的数据集,于是我改进了一下,条件是:预测样本必须满足样本集包括的前6个特征。也可不以西瓜为数据集。
2022-12-09 16:27:50 7KB 决策树 随机森林
1