kmeans聚类算法是一种迭代求解的聚类分析算法。其实现步骤如下: (1) 随机选取K个对象作为初始的聚类中心 (2) 计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。 (3) 聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类聚类中心会根据聚类中现有的对象被重新计算。 (4) 重复步骤2、3直到满足某个终止条件。终止条件可以是聚类中心再发生变化或者误差平方和局部最小等。 此代码可直接运行,在此基础上进行二次开发任务!
2023-03-07 20:37:09 2KB matlab kmeans聚类算法
1
离群检测在许多应用领域中显示出越来越高的实用价值,例如入侵检测,欺诈检测,电子商务中犯罪活动的发现等。 已经开发出许多用于离群值检测的技术,包括基于分布的离群值检测算法,基于深度的离群值检测算法,基于距离的离群值检测算法,基于密度的离群值检测算法和基于聚类的离群值检测。 频谱聚类作为近年来出现的竞争性聚类算法备受关注。 但是,它不能很好地扩展到现代大型数据集。 为了部分规避此缺点,在本文中,我们提出了一种受谱聚类启发的新的异常值检测方法。 我们的算法结合了kNN的概念和频谱聚类技术,通过在特征空间中统计地使用特征值和特征向量的信息,获得异常数据作为离群值。 我们将我们的方法与基于距离的离群值检测方法和基于密度的离群值检测方法的性能进行比较。 实验结果表明,我们的算法可以有效地识别异常值。
2023-03-06 11:01:42 225KB distance-based outlier detection density-based
1
1.分句 - 4 - 2.分词 - 4 - 3.去除停用词和特殊字符 - 5 - 4.去除超高频词与低频词 - 5 - 1.聚类效果 - 11 - 2.兰德指数
2023-03-04 11:14:41 960KB 聚类
1
资源给大家带来一个利用卷积神经网络(pytorch版)实现空气质量的识别分类与预测。 我们知道雾霾天气是一种大气污染状态,PM2.5被认为是造成雾霾天气的“元凶”,PM2.5日均值越小,空气质量越好. 空气质量评价的主要污染物为细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)等六项。
1
针对传统WLAN指纹定位算法中存在的定位精度低、稳定性差、实时性不高等问题,提出一种基于CMAES-SVR的WLAN室内定位算法。该算法首先对接入点(AP)的接收信号强度(RSS)进行统计分析,采用高斯滤波对信号进行预处理,然后利用K-means聚类算法将原始指纹数据库中的定位区域进行聚类分块;其次采用协方差矩阵自适应进化策略(CMAES)优化支持向量回归机(SVR)参数,从而建立CMAES-SVR室内定位学习模型,通过该模型分别构建各定位子区域中RSS信号与物理位置非线性映射关系;最后判断测试点所属类簇,根据该类簇中训练好的CMAES-SVR模型进行回归预测。实验结果表明,与WKNN、传统SVR以及PSO-SVR算法相比,该算法在定位精度、稳定性以及实时性方面均有所提高。
2023-03-02 11:26:02 1.18MB 室内定位 位置指纹 聚类分析
1
The code of Local Gravitation Clustering, see in the paper "Clustering by Local Gravitation " http://ieeexplore.ieee.org/document/7915751 citation: Z. Wang et al., "Clustering by Local Gravitation," in IEEE Transactions on Cybernetics, vol. 48, no. 5, pp. 1383-1396, May 2018. For Chinese readers who visit this page from my dissertation: 我的毕业论文的知网CAJ格式中很多图表显示有问题, 可能的原因是知网的CAJ格式对矢量图的支持不好, 而我提交的pdf版
2023-03-02 10:08:11 5KB matlab
1
聚类算法的简单总结。聚类分析的算法可以分为划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-Based Methods)。
2023-03-01 20:27:59 19KB 聚类
1
k-means聚类算法及matlab代码贝叶斯非参数小方差渐近聚类 这是贝叶斯非参数小方差渐近聚类算法库:DP均值,动态均值,DP-vMF均值,DDP-vMF均值。 出于比较原因,该库还实现了k均值和球形k均值。 该库带有一个可执行文件,该可执行文件允许使用DP-vMF-means,DP-means,球形k-means和k-means进行批量聚类。 示出了算法的简单性。 有关使用DDP-vMF-means的示例,请参考,该文档依赖于此程序包的dpMMlowVar库使用DDP-vMF-means从Kinect RGB-D流执行实时方向分割。 如果您使用DP-vMF手段或DDP-vMF手段,请引用: Julian Straub, Trevor Campbell, Jonathan P. How, John W. Fisher III. "Small-Variance Nonparametric Clustering on the Hypersphere", In CVPR, 2015. 如果您使用动态均值,请引用: T. Campbell, M. Liu, B. Kulis, J. How
2023-02-27 22:55:23 2.59MB 系统开源
1
图像压缩矢量量化 使用随机初始化对聚类中心进行图像压缩的 k-means 的实现
2023-02-27 22:16:07 202KB MATLAB
1
在Python中使用K-Means聚类和PCA主成分分析进行图像压缩 各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比表示。 图像压缩需要几个Python库,如下所示: # image processing from PIL import Image from io import BytesIO import webcolors # data analy
2023-02-27 22:15:11 267KB ns 主成分分析 聚类
1