K均值的时间复杂度为NKTD,其中,N代表样本个数,K代表k值,即聚类中心点个数,T代表循环次数,D代表样本数据的维度。 本算法的改进主要在以下方面: 一, 初始聚类中心点,传统的初始中心点是随机选择,由于K均值算法受初始中心点影响较大,为获得更好的效果,在本方法中,先将数据采用层次聚类的方法预处理,得到的k个中心点作为K均值算法的中心点。 二, 传统的聚类中心点更新是在结束一次循环后,本方法的聚类中心采用实时更新策略,即每次将一个模式归于一个新的聚类中心时,即立刻更新新的所属中心和原属聚类中心的中心值,增强算法的收敛性。 三, 为达到类内方差最小化,类类方差最大化这一原则,考虑到往往设定的K值不一定能很好实现聚类效果,故将以往的固定聚类中心改为一浮动区间。原有K为最小聚类中心个数,另设一聚类中心个数上限maxK。其具体实现如下: 1) 当一待聚类的模式得到其最近中心时,计算该聚类中心类内方差和将此模式归于该中心之后的类内方差,如果两者差别大于某设定阈值,则以该模式数据为基础,得到一新的聚类中心。 2) 当当前聚类中心个数等于设定的最大聚类中心时,合并最相邻的两个聚类。为使得到的聚类效果更为均衡,应该优先合并维度较小的聚类类别。
2022-12-19 08:49:27 1.85MB 层次聚类 K均值 不定K
1
将传统均值漂移算法进行改进,针对有遮挡,目标快速变化以及目标尺度变化等情况进行改进
2022-12-19 04:08:09 370KB 均值漂移算法 改进 遮挡
1
使用加权均值偏移的线段检测
2022-12-17 21:02:25 3.86MB 开源软件
1
主要用的numpy库实现的,其中数据点的生成可以看我另外一个作业模式识别作业:....聚类设计那个用来生成数据
2022-12-14 18:15:59 34KB python k_means C均值 聚类
1

使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分为两部分:对连续状态空间进行自适应离散化的状态空间学习,使用K-均值聚类算法;寻找最优策略的策略学习,使用替代合适迹Sarsa学习算法.对连续状态的强化学习基准问题进行仿真实验,结果表明该方法能实现对连续状态空间的自适应离散化,并最终学习到最优策略.与基于CMAC 网络的强化学习方法进行比较,结果表明该方法具有节省存储空间和缩短计算时间的优点.

1
利用K均值聚类IRIS数据,包括两个程序: 一、基于欧氏距离聚类 二、基于余弦距离聚类 二者聚类效果不同,输出结果包括:轮廓图、聚类结果可视化(标注明聚类错误样本)、聚类正确率。
2022-12-09 09:29:47 92KB 机器学习 聚类算法 iris K均值
1
C语言实现了K均值算法,包含两个文件,一个是纯C++语言版本的,可直接运行,另一个是C和Matlab混合版本,图形化运行结果,能够以不同颜色标识不同的聚类,用的是matlab引擎,代码已经写好,只是需要用户自己在集成开发环境如Visual Stuio中配置一些引用matlab的环境,具体配置可参考网上的matlab和C引擎混合。
2022-12-08 23:18:46 3KB K-means C语言 Matlab引擎 GUI
1
针对传统的模糊C-均值聚类算法对初始聚类中心较敏感、易陷入局部最优的缺点,将粒子群优化算法和FCM算法相结合,提出一种改进的模糊聚类算法。该算法利用粒子群算法的全局搜索能力代替FCM算法寻找初始聚类中心,使其跳出局部最优,实现模糊聚类。主要从反映数据集分类的类内紧致性程度和类间分离性程度的角度考虑,重新设计适应度函数。实验结果表明,提出的算法在聚类正确率和有效性指标上有更好的效果。
1
Kmean、K均值聚类、无监督matlab算法若干案例,内含数据。
2022-12-06 15:25:49 22KB Kmean 无监督 内含数据 若干案例
1
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小
2022-12-02 20:40:54 2KB matlab
1