单元3专案 介绍 目标: 心血管疾病(CVD)是全球主要的死亡原因,每年夺走约1700万人的生命。 我们对该项目的目标是,在预测CVD的患病率时,提供能够识别和定义保护因素和风险因素的最佳模型。 通过了解这些因素,我们将能够针对最佳的一级预防方法,并帮助阻止患者中某些CVD的可能发展。 问题: 就准确性而言,这类数据集表现最佳的“原始”模型是什么? 在对有和没有CVD的患者进行分类时,最重要的因素是什么? 在预测观察结果是否患有CVD时,最重要的风险和保护因素是什么? 方法 在这个项目中,我们将使用OSEMN流程: 获取:我们的数据集是从Kaggle的网站收集的,然后下载到我们计算机上的本地文件中。 检查和清理:这是我们检查干净数据的地方。 在本节中,我们将寻找:离群值,空值,确保某些列中的值合理,并查看每列中的值的类型(分类与数字)。 探索:我们会查看数据以及要素与目标之
2021-09-28 18:57:19 15.81MB JupyterNotebook
1
机器学习CNN模型在心血管疾病诊疗中的临床应用及研究进展.pdf
2021-09-25 17:02:29 1.37MB 机器学习 参考文献 专业指导
工欲善其事必先利其器,心血管疾病就是你学习这一行业最好的工具,希望心血管疾病不会让你失望。PS:可下...该文档为心血管疾病,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
2021-07-05 16:04:59 31KB
1
心血管疾病预测
2021-06-13 17:56:26 986KB JupyterNotebook
1
逻辑回归 在全球范围内,心血管疾病(CVD)造成的死亡人数多于癌症。 从这项为期15年的心脏研究队列中收集的真实心脏病患者的数据集可用于此任务。 该数据集具有16个患者特征。 请注意,所有功能均不包含任何验血信息。 脚步 检查每个属性/列的描述性统计数据 检查班级不平衡 建立物流模型 确定特征重要性 评估模型的性能指标 要求 Python Google Colab 配套 将熊猫作为pd导入 从sklearn.datasets导入load_iris 从sklearn.linear_model导入LogisticRegression 从sklearn导入指标 从sklearn.metrics导入f1_score 导入matplotlib.pyplot作为plt 将numpy导入为np 从sklearn导入linear_model 从sklearn.model_selection导
2021-06-12 15:29:39 18KB JupyterNotebook
1
心脏疾病预测 来自Kaggle的心血管疾病数据集-用于培训。
2021-05-12 19:00:45 2.78MB JupyterNotebook
1
心血管疾病的趋势和决定因素 简要说明:分析了WHO MONICA(心血管疾病趋势和决定因素的跨国监测)数据集,以查找与心血管疾病死亡率相关的人口统计学和生理指标。 使用卡方检验执行单变量和多变量分析,以找到具有战略意义的变量,并绘制图表以可视化所生成的输出。 进行逻辑回归以发现预测因素之间的关联强度,例如高胆固醇,吸烟状况,高血压和先前的心肌梗死可预测结果(死亡或活着)。 最佳发现:住院状态是心血管疾病死亡率的最强预测指标。 KNN方法优于多变量logistic回归模型,该模型产生的McFadden R2值在55-65%的中等范围内。 决策树方法产生了关于男性死亡的最准确预测(77%),而Wheareas Random Forest产生了女性死亡的最准确预测(78.6%)。
2021-03-17 17:52:15 3.32MB HTML
1