本文首先对比通用搜索引擎与主题搜索引擎的区别,总结主题搜索引擎的优点;然后介绍目前世界上主题搜索引擎技术的发展状况。接着,综述了面向主题中文搜索引擎的设计,详细介绍涉及该领域的三个核心技术:文档分类技术、中文处理技术和网页搜集预测技术。对于以上三种技术,我们在简述已知算法的基础上,都阐述了具体系统的实现方案。其中中文切词问题作为工作的重点,在文章中有比较详尽的介绍,包括中文处理的背景知识,中文切词软件的基本原理和中文切词词典的改进。
2022-03-07 09:33:07 344KB 聚类
1
对KNN文本分类算法进行改进,提高文本分类正确率和分类效率.
2022-03-04 16:46:20 199KB KNN算法 文本分类
1
机器学习 代码分享机器学习 代码分享机器学习 代码分享
2022-03-01 13:40:27 21KB 机器学习
1
主要为大家详细介绍了python使用KNN算法识别手写数字,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
1
邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。
2022-02-20 16:09:27 723KB knn算法
1
kNN算法又称为k近邻分类。KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
2022-02-10 23:16:03 113KB KNN
1
【工控老马出品,必属精品,亲测校正,质量保证】 资源名:matlab实现knn算法程序源码.zip 资源类型:程序源代码 源码说明: 基于matlab实现knn算法程序源码 包含完整源码和注释 非常适合借鉴学习 适合人群:新手及有一定经验的开发人员
基于对zoo数据流的实验,数据前70作训练集,后30作测试集,计算距离方式汉明和欧式两种(标了注释),自己加了折线图表现结果
2022-01-29 09:11:54 3KB python 人工智能 算法 开发语言
1
KNN算法实战.zip
2022-01-17 17:02:59 16KB KNN算法
1
KNN算法实战.zip
2022-01-17 09:06:48 158KB 机器学习
1