利用Python实现数据挖掘经典算法K-means,K-means坐标点由random随机生成。
2021-11-23 21:58:29 1KB Python K-means 随机生成坐标
1
代码实现了聚类算法中的K-Means(k=2,k=3)和DBSCAN两个算法。
2021-11-23 17:39:46 128KB K-Means DBSCAN
1
基于 K-means 聚类算法的图像区域分割,首先从数据样本种选取K个点作为初始聚类中心,其次计算各个样本到聚类的距离,把样本归到离它最近的那个聚类中心所在的累,计算新形成的每个聚类的数据对象的平均值来得到新的聚类中心,最后重复以上步骤,直到相邻两次的聚类中心没有任何变化,说明样本调增结束,仿真代码亲测可用,有很高的参考价值
1
用于测试k-means的小型数据样本,原理和代码请参照我的博客
2021-11-22 19:51:58 314B k-means 数据 测试
1
改进的K-means算法在维文连体段聚类中的应用
2021-11-22 14:41:03 1.42MB 研究论文
1
buades原始NLM算法的C语言实现,速度较慢,
2021-11-22 13:08:48 5KB nonlocal C
1
本地开发和运营 依存关系 确保您已将Python 2.7和pip一起安装。 然后运行: pip install -r requirements.txt 正在运行的工作 使用中央作业运行程序模块src/index.py运行所有作业。 您完全不需要编辑此文件。 python src/index.py 参数: src/spark_jobs.py定义的作业功能名称 生成的簇数 数据文件的文件路径(可以是项目中的绝对路径或本地路径) 这些作业可以占用多个文件。 这些应仅附加到命令中。 例如: python src/index.py user__reputation__to__upvotes_cast 3 tests/fixtures/users.xml 新增工作 所有作业均从src/s
2021-11-22 02:29:49 3.4MB python spark clustering pyspark
1
k-means聚类算法的研究.pdf
2021-11-19 13:01:47 132KB
算法优缺点: 优点:容易实现 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢 使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。 1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,这里k值的选择对结果的影响很大,Ng的课说的选择方法有两种一种是elbow method,简单的说就是根据聚类的结果和k的函数关系判断k为多少的时候效果最好。另一种则是根据具体的需求确定,比如说进行衬衫尺寸的聚类你可能就会考虑分成三类(L,M,S)等 2.然后我们需要选择最初的聚类点(或者叫质心),这里的
2021-11-19 12:27:21 250KB k-means k-means算法 k均值聚类算法
1
项目包含广告渠道90天内额日均UV,平均注册率、平均搜索率、访问深度、平均停留时长、订单转化率、投放时间、素材类型、广告类型、合作方式、广告尺寸和广告卖点等特征,将渠道分类,找出每类渠道的重点特征,为业务讨论和数据分析提供支持。 项目包含原始数据集和源代码
2021-11-19 12:03:25 617KB K-means 广告聚类实现
1