心血管疾病的趋势和决定因素
简要说明:分析了WHO MONICA(心血管疾病趋势和决定因素的跨国监测)数据集,以查找与心血管疾病死亡率相关的人口统计学和生理指标。
使用卡方检验执行单变量和多变量分析,以找到具有战略意义的变量,并绘制图表以可视化所生成的输出。
进行逻辑回归以发现预测因素之间的关联强度,例如高胆固醇,吸烟状况,高血压和先前的心肌梗死可预测结果(死亡或活着)。
最佳发现:住院状态是心血管疾病死亡率的最强预测指标。 KNN方法优于多变量logistic回归模型,该模型产生的McFadden R2值在55-65%的中等范围内。 决策树方法产生了关于男性死亡的最准确预测(77%),而Wheareas Random Forest产生了女性死亡的最准确预测(78.6%)。
2021-03-17 17:52:15
3.32MB
HTML
1