10万条社会类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自。说明一下本身资源需要积分很少,不知道怎么现在变成这么多
2019-12-21 19:28:33 122.51MB 新闻分类 新闻数据集 机器学习 文本分类
1
使用贝叶斯分类器实现文本文件的分类判别。 1、可以指定训练集进行文本训练; 2、使用训练好的特征值进行未知文件类型的判别。
2019-12-21 19:24:26 1.76MB 贝叶斯 文本分类
1
数据挖掘文本分类语料库(中文)-李荣陆老师的一部分资料
2019-12-21 19:24:06 3.82MB 分类语料
1
复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文文本分类语料无法下载,网上找到了训练集和测试集,4积分,良心价
2019-12-21 18:58:39 105.99MB 复旦文本分类 文本分类 中文数据集
1
java写的朴素贝叶斯文本分类代码,有详细说明
2019-12-21 18:58:28 1.78MB 贝叶斯 Bayes 文本分类
1
中文文本分类语料(复旦)训练集+测试集(100M)完整版
2019-12-21 18:58:20 103.25MB 中文文本分类 分类语料 训练集 测试集
1
基于卷积神经网络处理中文文本分类
2019-12-21 18:58:15 20KB cnn 中文文本分类
1
1998年1月-6月人民日报语料库,已做词性标记,适用于自然语言处理序列标注等任务,如命名实体识别等,里面包含6个月份
2019-12-21 18:58:10 11.5MB 文本分类语料
1
基于LDA文本分类的python实现版本
2019-12-21 18:57:42 70KB LDA 文本分类 python
1
针对中文短文本篇幅较短、特征稀疏性等特征,提出了一种基于隐含狄利克雷分布模型的特征扩展的短文本分类方法。在短文本原始特征的基础上,利用 LDA 主题模型对短文本进行预测,得到对应的主题分布,把主题中的词作为短文本的部分特征,并扩充到原短文本的特征中去,最后利用 SVM 分类方法进行短文本的分类。实验表 明,该方法在性能上与传统的直接使用 VSM 模型来表示短文本特征的方法相比,对不同类别的短文本进行分类,都有不同程度的提高与改进,对于短文本进行补充 LDA 特征信息的方法是切实可行的。
2019-12-21 18:56:42 1.14MB LDA 短文本分类
1