蛋白质定位位点的分析是生物信息学中的重要任务。在具有多个指标/特征的基于酵母蛋白质测量数据的众多研究方法中,预测酵母蛋白质定位位点是一个有前途的领域。为了反映这些特征对预测任务的不同贡献,提出了一种基于加权特征集合(WFE)的聚类算法,以基于收集的酵母蛋白质定位数据预测酵母蛋白质定位位点。 WFE过程首先为特征分配不同的权重,然后对结果进行计算和呈现以获得最佳结果。对基于WFE的算法和其他几种基于加权特征思想的聚类算法的实验结果表明,我们的新算法在准确性和稳定性方面均优于其他特征加权类型算法。
2024-01-15 16:41:23 957KB Clustering Algorithm; Yeast Protein
1
针对K-means算法因随机选取聚类中心而易造成聚类结果不稳定的问题,提出PCA-KDKM算法。该算法使用主成分分析法对数据集的属性降维,提取主属性;利用k′dist曲线自动获取k值;计算平缓曲线上所含数据对象的均值并选取其中一值,作为首个初始聚类中心;利用基于密度和最大最小距离的算法思想进行聚类;结合类间距离和类内聚类提出聚类质量评价函数。将该算法与K-means、KNE-KM、QMC-KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定,聚类准确率高。将PCA-KDKM算法应用在微博舆情分析中,抓取不同类别的数万条数据进行聚类分析。实验结果表明,PCA-KDKM算法在微博舆情分析中有更高的准确性和稳定性,有利于及时发现热点舆情。
2024-01-11 11:38:00 437KB K-means算法 聚类 质量评价函数
1
改进的 K-means 聚类算法
2024-01-09 17:06:23 361KB k-means
1
K-means 对 iris 数据进行聚类并显示聚类中心,聚类结果等,附注释
2023-12-30 13:53:10 4KB kmeans 聚类 数据挖掘 机器学习
1
DBSCAN(Density-BasedSpatialClustering ofApplicationswithNoise)聚类算法,它是一种基于高密度连通区域的、基于密度的聚类算法,能够将具有足够高密度的区域划分为簇,并在具有噪声的数据中发现任意形状的簇。我们总结一下DBSCAN聚类算法原理的基本要点:DBSCAN算法需要选择一种距离度量,对于待聚类的数据集中,任意两个点之间的距离,反映了点之间的密度,说明了点与点是否能够聚到同一类中。由于DBSCAN算法对高维数据定义密度很困难,所以对于二维空间中的点,可以使用欧几里德距离来
2023-11-22 20:43:52 679KB
1
利用k_means聚类算法的MapReduce并行化实现,为学习hadoop的同学提供参考
2023-11-17 15:02:23 258KB kmeans mapreduce
1
java k-means可视化程序
2023-11-13 07:00:48 48KB java k-means可视化程序
1
数据挖掘实战聚类分析的资源,包括城市消费因素的数据集和k-means,k-medoids,层次聚类,Som四种聚类分析算法的代码。
1
k-means聚类分析MATLAB仿真代码
2023-10-15 14:27:04 3KB matlab kmeans 软件/插件
1
数据集: Id R F M 1 27 6 232.61 2 3 5 1507.11 3 4 16 817.62 4 3 11 232.81 5 14 7 1913.05 6 19 6 220.07 7 5 2 615.83 8 26 2 1059.66 9 21 9 304.82 10 2 2 1227.96 11 15 2 521.02 代码: # -*- coding: utf-8 -*- # @File : k-means.py # @Date : 2020-02-18 9:58 # @Author : admin
2023-10-15 11:51:17 123KB em ema man
1