利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
2019-12-21 18:51:55 173KB ictclas knn struts2 中文分词
1
基于svm的中文文本自动分类系统的语料库, 包含了17类, 全部都是自己爬的. 详情:http://blog.csdn.net/yinchuandong2/article/details/17717449
2014-07-23 00:00:00 10.19MB 语料库 自动分类 svm
1