k-means算法 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。相似度的计算根据一个簇中对象的平均值来进行。 算法首先随机地选择k个对象,每个对象初始地代表了一个簇的平均值或中心。对剩余的每个对象根据其与各个簇中心的距离,将它赋给最近的簇。然后重新计算每个簇的平均值。这个过程不断重复,直到准则函数收敛。 准则函数试图使生成的结果簇尽可能地紧凑和独立。 算法5-1 k-means算法 输入:簇的数目k和包含n个对象的数据库。 输出:k个簇,使平方误差准则最小。 (1)assign initial value for means; /*任意选择k个对象作为初始的簇中心;*/ (2) REPEAT (3) FOR j=1 to n DO assign each xj to the closest clusters; (4) FOR i=1 to k DO / *更新簇平均值*/ (5) Compute /*计算准则函数E*/ (6) UNTIL E不再明显地发生变化。
2022-03-17 12:13:50 598KB 聚类 数据挖掘 伪代码 例子
1
 针对电力大数据收集和存储中数据量大、数据收集不精准的问题,提出了基于改进K-means算法的电力大数据系统的设计。对传统K-means算法进行分析,提出改进之后的K-means算法。根据改进后算法设计电力大数据系统,对系统的架构进行分析,包括数据存储、设备层、数据接入等模块。对设计的电力大数据系统进行实验,实验结果表明,文中设计的电力大数据系统能够满足实际需求,提高系统的存储和处理效率。
2022-03-15 16:55:36 1.48MB K-means算法 电力 大数据 架构分析
1
非本地手段 介绍 在这个项目中,我以幼稚的方式并使用积分图像实现了非局部均值过滤。 这些文件中都对这两种方法进行了解释: 非本地均值降噪 用于块匹配的积分图像 描述 非局部均值算法用于去除图像中的噪点。 我们输入了三件事: 我们要去噪的图像 大小为kxk的内核 wxw大小的窗口 对于图像中的每个像素(我们将要去噪),我们将窗口围绕其居中,通常,该窗口是相当大的,但出于性能方面的考虑,当然不如整个图像大。 然后,对于窗口中的每个像素,我们滑动一个补丁(通常为3x3或5x5),我们要去噪的像素将是图像补丁上的加权和。 整体影像改善 如果我们使用积分图像,则可以加快计算速度。 伦敦大学学院图像处理课程中的Lourdes Agapito教授的图像幻灯片 由于以下公式,我们可以加快计算速度: 图片摘自Wikipedia( ) 如何使用代码 只需打开Matlab并为完整的图像实现运行nonL
2022-03-15 13:41:54 16.1MB MATLAB
1
kmeans:是用Go编写的k-means聚类算法实现
2022-03-14 15:29:02 3.66MB Go开发-数据结构和算法
1
k-means聚类算法及matlab代码调制分类 一种基于我的论文的新方法 用MATLAB Nowly编写,然后导入到Python 单载波调制算法分为两部分。 k-means聚类处理主要任务,而k-center greedy algorithm提高了k-means的性能。 这两个函数一起编译输入信号,该输入信号是复数的数组,并将它们映射到同相正交图上。 在此IQ图上,确定聚类中心,然后将结果传递到另一个代码,该代码确定输入信号的调制类型是什么。 考虑的调制类型是任何M-ary QAM和M-ary PSK调制,它们涵盖了当今大多数流行的调制。 k中心贪婪算法 此功能用于初始化k-means聚类。 通过之前进行该k-means聚类,表现k-means如图我的纸显著改进: 随机初始化它们时,该性能优于k-meansk-means++算法。 与执行此操作相比,执行此操作的成本也很小,因为它可以扫描theta(N)时间中的点,并且还可以提高此性能。 这是度量k-center optimization problem的贪婪近似算法,在k次迭代中达到2的近似因子。 贪婪算法的工作原理如下: 任意选
2022-03-14 10:27:40 25KB 系统开源
1
图像分割方向论文的思维导图
2022-03-13 11:08:15 134KB 图像处理
1
K均值(k-Means)算法的推导 问题框架 要估计k个正态分布的均值= 观察到的数据是X={} 隐藏变量Z={}表示k个正态分布中哪一个生成xi 用于K均值问题的表达式Q(h’|h)的推导 单个实例的概率
2022-03-12 16:49:34 7.1MB 机器学习 算法汇总
1
通过对基于K-means聚类的缺失值填充算法的改进,文中提出了基于距离最大化和缺失数据聚类的填充算法。首先,针对原填充算法需要提前输入聚类个数这一缺点,设计了改进的K-means聚类算法:使用数据间的最大距离确定聚类中心,自动产生聚类个数,提高聚类效果;其次,对聚类的距离函数进行改进,采用部分距离度量方式,改进后的算法可以对含有缺失值的记录进行聚类,简化原填充算法步骤。通过对STUDENT ALCOHOL CONSUMPTION数据集的实验,结果证明了该算法能够在提高效率的同时,有效地填充缺失数据。
1
用matlab仿真实现的K-MEANS改进聚类,可以运行
2022-03-11 21:14:12 5KB matlab kmeans
1
k-means 算法的matlab代码 基于多特征分析的视频窜改检测算法 运行平台:Matlab 简要使用说明 利用两个算法来检测视频是否经过篡改,方法1针对大范围帧间篡改(帧删除、帧替换、帧插入); 方法2作为方法1的补充,对小范围篡改也许会有一点改善(然而并没有); 方法1:基于视频相关性变化的视频篡改检测算法 利用视频内容具有连续性这一特点,提取相关性变化度这一特征,通过K-means算法挑出帧异常点; 方法2:基于运动矢量分析的视频篡改检测 利用光流法求出运动矢量,将运动矢量这一阶段特征输入SVM分类器,通过学习后训练出模型,将待检测视频导入训练模型,检测篡改点; 代码说明 对主要的程序进行简单说明 为利用相关性变化度为特征,利用二次切比雪夫挑出离群点; [1]黄添强, 陈智文, 苏立超,等. 利用内容连续性的数字视频篡改检测[J]. 南京大学学报(自然科学版), 2011, 47(5):493-503. 为方法1; <checkErrorFramePointBySV
2022-03-10 10:17:46 9KB 系统开源
1