对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2022-01-07 10:25:16 685KB 5.1
1
数字半色调是在二值设备或多色二值设备上实现图像再现的一门技术, 提出将K-means 聚类法应用在数字半色调技术中。算法中应用人类视觉系统模型HVS和印刷模型最大限度减少原始灰度连续调图像和半色调图像之间的视觉误差; 利用K-means聚类法将灰度图像划分成聚类分区, 在每个聚类分区应用最小平方法least-squares最小化二值半色调图像和原始灰度级图像之间的平方误差, 所构造的半色调算法与基于模型的最小平方法LSMB算法相比, 随着聚类分区的增加, 图像平滑且边缘清晰度增加, 尤其是在图像细节部位。与LSMB算法比较, 该算法的均方误差值有所降低, 而权重信噪比和峰值信噪比提高了0. 2~2 dB, 模拟实验结果验证了算法的有效性。
1
JAVA文本聚类 K-MEANS TFIDF 纯JAVA源代码,可运行。
2022-01-04 16:22:52 8KB JAVA文本聚类 K-MEANS TFIDF
1
K均值 K均值聚类和颜色量化
2022-01-04 12:28:45 1KB
1
大数据挖掘课程作业。提出一种利用聚类和分类等数据技术来挖掘B站中具有高价值的up主。通过挖掘B站up主的视频播放信息,能够获得其点赞量、播放量、留言反馈等各种信息。基于这些信息对up主进行聚类,讲up主分为不同价值的群体。文中主要使用K-Means聚类算法来对B站up主群体进行分类,从而反映出不同up主的价值,并以此为依据来推送有高价值的up主,于平台、于用户而言都是有益的。实验结果显示,该方法展现出很好的分类效果。
2022-01-04 11:05:54 493KB 大数据
1
该函数用于训练用于矢量量化的码本。 首先将数据集拆分为两个集群,然后找到每个集群的均值(质心)。 找到每个向量与这些质心的距离,并且每个向量都与一个集群相关联。 每个簇的向量均值首先替换质心。 如果总距离没有显着提高,则质心每个都分裂为两个。 这种情况一直持续到达到所需的集群数量并且改进不大。
2021-12-31 05:23:23 4KB matlab
1
机器学习部分聚类 SVM PCA详细代码实例,并附有数据集。
2021-12-30 12:37:09 17.77MB K-means 、SVM、PCA
1
基于matlab的表情识别代码数据挖掘 项目1 在本作业中,您将研究k最近邻,神经网络和SVM分类器在两个实际分类问题上的应用。 用于此分配的数据集已上传到“数据集”文件夹下。 x_train,y_train,x_test和y_test分别表示训练功能,训练标签,测试功能和测试标签。 在x_train和x_test中,每一行代表一个数据样本,每一列代表一个特征。 问题1 人类活动识别数据集是根据对30名志愿者进行的实验而创建的,以使用智能手机数据识别人类活动。 每个人都在腰部佩戴智能手机(三星Galaxy S II)进行六项活动(步行,步行,上楼,下坐,坐着,站立,躺着)。 使用其嵌入式加速度计和陀螺仪,可以以50Hz的恒定速率捕获3轴线性加速度和3轴角速度。 使用信号处理算法处理数据以提取维度561的特征向量。训练集包含7,352个样本,测试集包含2,947个样本。 在此数据集上实现k = 5的k最近邻算法。 使用简单的欧几里德距离度量来计算两个样本之间的距离。 在训练集上训练带有参数2的多项式内核的SVM分类器,并在测试集上进行测试。 您需要为每个课程训练一个SVM。 为了预测测试
2021-12-29 15:56:20 34.77MB 系统开源
1
Matlab代码sqrt 该存储库包含用于产生手稿结果的代码:()。 代码-PCSKM exeSimus.m:运行整个分析并将结果存储在./GenRes/results文件夹中。 该文件包含以下选项: 确定: 0/1开始时不带或带有随机种子。 JMPCKM_OVERLOAD: 0/1使用重载或非重载MPCK-Means。 该库用于MPCK-Means算法。 看 。 CONSTR_PERC: 0/1根据大小使用固定数量的约束或百分比。 日志: (0)无日志文件且无显示,(1)仅日志文件,(2)仅显示,(其他)显示和日志文件。 constraints_type:要使用的约束类型; 0/1激活ML和/或CL,当从所有可用约束中选取-1则随机约束时,则同时选择了1则相等数量的每种类型的牺牲子。 Constraints_number:要使用的固定值或约束的百分比。 citer:每个约束的迭代次数 sstep:要测试的稀疏性参数值,从步骤1.1到sqrt(尺寸),步长为sstep 。 maxIter:算法迭代以达到收敛。 k折:选择k进行k折验证。 CVstatsPer.m:生成有关数据集的统计信
2021-12-28 15:40:03 5.59MB 系统开源
1