癌症是导致人类死亡的众所周知的疾病,乳腺癌(BC)是女性诊断出的癌症之一。 一生中大约有八名女性被诊断出患有BC。 如果尽早诊断出BC,可以很容易地进行治疗。 这项研究的方法是通过不同的机器学习(ML)技术来识别患有BC或不患有BC的患者。 在这项研究中,威斯康星州诊断性乳腺癌(WDBC)数据集将通过支持向量机(SVM),k最近邻(k-NN),朴素贝叶斯(NB),决策树(DT)和逻辑回归(LR)进行分类)。 分类之前有一个预处理阶段,其中五个不同的分类器应用了5倍交叉验证方法。 分类性能是通过使用混淆量度通过性能测量参数(即准确性,敏感性和特异性)来测量的。 在这项研究中,SVM在归一化过程后发现的最佳性能为99.12%的精度。
2022-05-21 16:38:44 544KB Breast Cancer WDBC SVM
1
Breast cancer survival.sav 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:03 38KB R spss
1
优点:基于微波雷达的成像工具箱(MERIT)是免费的开源软件,用于基于微波雷达的成像。 包括入门指南和示例数据,MERIT是一个灵活,可扩展的框架,用于开发,测试,运行和优化基于雷达的成像算法
2022-03-20 14:51:32 456KB matlab radar matlab-toolbox breast-cancer
1
乳腺癌检测应用 使用机器学习XGBoost分类器的乳腺癌检测应用程序
2021-12-31 09:32:00 1.93MB HTML
1
与所有其他癌症相比,乳腺癌是女性发生的第二大癌症。 2004 年记录了大约 110 万例病例。观察到这种癌症的发病率随着工业化和城市化以及早期检测设施的增加而增加。 它在高收入国家仍然更为常见,但现在在包括非洲、亚洲大部分地区和拉丁美洲在内的中等和低收入国家Swift增加。 在所有病例中,乳腺癌是致命的,并且是女性癌症死亡的主要原因,占全球所有癌症死亡人数的 16%。 本研究论文的目的是提出一份关于乳腺癌的报告,我们利用这些可用的技术进步来开发乳腺癌存活率的预测模型。 我们使用了三种流行的数据挖掘算法(朴素贝叶斯、RBF 网络、J48)来开发使用大型数据集(683 例乳腺癌病例)的预测模型。我们还使用了 10 倍交叉验证方法来测量无偏估计用于性能比较目的的三个预测模型。 结果(基于平均准确度乳腺癌数据集)表明,朴素贝叶斯是最好的预测器,对保持样本的准确度为 97.36%(该预测准确度比文献中报道的任何预测准确度都要好),RBF 网络出来了第二个以 96.77% 的准确率,J48 以 93.41% 的准确率排在第三位。
2021-12-19 13:23:16 394KB Breast cancer data
1
使用机器学习进行乳腺癌诊断 该项目的目的是采用UCI机器学习存储库中的乳腺癌威斯康星州(诊断)数据集,并应用Logistic回归,朴素贝叶斯,支持向量机,决策树和多层感知器等机器学习模型来提取特征可能最适合预测癌症性质的数据集。 目的是对乳腺癌是良性还是恶性进行分类。 确定基于模型预测的模型的准确性,以相互分析和比较生成的模型,并从模型中选择最佳模型。 多层感知器是测试过的模型中最准确的模型,准确度为97.2%。
2021-12-16 17:06:04 1.45MB JupyterNotebook
1
作为全球女性中最常见的癌症之一,乳腺癌引起了研究人员的最多关注。 经证实,准确及早发现乳腺癌可以增加患者采取正确治疗方案并长期生存的机会。 本文旨在探讨可用于从常规血液分析数据预测乳腺癌的生物标志物的范围。 支持向量机(SVM)已经为癌症分类领域做出了重要贡献。 然而,不同的核函数配置及其参数会显着影响 SVM 分类器的性能。 为了提高 SVM 分类器对乳腺癌诊断的分类精度,本文提出了一种新的癌症分类算法,该算法基于使用网格搜索算法的智能算法优化 SVM 分类器的相关参数这些参数是: 高斯径向基函数 (GRBF) 核SVM分类器的参数g和C惩罚参数。 我们的实验表明,使用网格搜索的 SVM 参数优化总是在给定范围内找到接近最佳的参数组合,以评估所提出模型的性能,使用取自 UCI 库的乳腺癌科英布拉数据集。 在这个数据集时代,使用了体重指数 (BMI)、葡萄糖、胰岛素、稳态模型评估 (HOMA)、瘦素、脂联素、抵抗素和趋化因子单核细胞趋化蛋白 1 (MCP1) 属性。 在该数据集上将所提出方法的性能与其他方法的性能进行比较。 获得的结果显示了对最先进算法的改进,具有改进的性能参数,例如疾病预测准确性、灵敏度和更好的 F1 分数等。 资金声明:作者表示,这项研究没有获得外部资金。利益声明:作者声明没有利益冲突。道德批准声明:不需要。
2021-12-15 15:39:06 1.17MB breast cancer; machine learning;
1
进行乳腺癌诊断的预测分析 使用Python中的K-Means聚类和随机森林算法
2021-11-18 00:26:10 14.22MB JupyterNotebook
1
决策树 对新患者进行分类的乳腺癌数据集的决策树。 训练数据 该模型是使用699例乳腺癌患者的数据集构建的。 数据集经过归一化和清洗,最终使500名患者接受了培训和测试的最终数据集。 共有500例患者,其中262例(52.4%)患有良性肿瘤,238例(47.6%)患有恶性肿瘤。 为了进行训练,使用了80%的数据,其中40%是良性肿瘤,40%是恶性肿瘤,其余20%用于测试。 在这20%中,12.4%来自良性肿瘤,而7.6%来自恶性肿瘤。 怎么跑 克隆存储库 启动你的服务器 现在,您可以从“决策树”中访问预测结果。 要查看命中率,请inspecionar并检查console 。 注释 src目录中的decision-tree.js文件已从以下存储库中删除,该存储库允许使用和修改: :
1
WPBC(预后)数据集包含 198 条患者记录,其中 4 条记录中缺少属性“淋巴结”状态的值。由于淋巴结值是决定乳腺癌状态的重要因素。 最终数据集包含 194 条记录,其中 148 条为非复发病例,46 条为复发病例。
2021-11-09 18:15:21 108KB UCI WPBC
1