只为小站
首页
域名查询
文件下载
登录
互联网评论数据集 (已划分)
适用于中文中长文本分类 原始数据集和已经划分的数据集已给出 划分的数据集经过数据预处理,删除了其中的重复文本,以及文本长度小于50的句子,最终构造的平衡语料 训练集 5800 测试集 1000条 验证集1000 (正负评论各站一半)
2023-01-15 11:06:10
3.33MB
自然语言处理
文本分类
中文文本分类数据集
1
toutiao-text-classfication-dataset.zip
中文文本分类数据集
合
2021-12-16 22:17:00
76.88MB
中文文本分类数据集
复旦大学
中文文本分类数据集
.rar
复旦中文文本数据集,包含训练集与测试集,数据集为TXT格式,可以进行文本分类实验,机器学习,深度学习,需要的可以下载。
2021-06-26 20:27:01
142.08MB
复旦数据集
文本分类
中文数据集
1
网易新闻数据,用于中文文本分类,已经打好标签且预处理好了
有24000条新闻,共六个类别,直接用python3的pickle.load()该文件即可,是一个24000个元素的list,list的每个元素是一个tuple,tuple的第一个元素是与处理好的文本,第二个元素是对应的标签。
2021-06-18 17:50:09
66.9MB
文本分类
自然语言处理
中文文本分类
数据集
1
cnews
中文文本分类数据集
cnews
中文文本分类数据集
;由清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史 数据筛选过滤生成,训练过程见我的博客;
2021-06-02 20:25:12
42.97MB
cnews
深度学习
数据集
1
复旦大学
中文文本分类数据集
-训练+测试
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-25 11:15:53
103.28MB
数据集
中文语料库
1
复旦大学
中文文本分类数据集
本语料库由复旦大学李荣陆提供。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ 密码:dq9m 使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-21 20:24:05
106.17MB
中文文本分类
数据集
1
中文文本分类数据集
.zip
新闻栏目中文文本分类,新闻栏目一共有: 体育 5000 时政 5000 房产 5000 家居 5000 财经 5000 时尚 5000 科技 5000 教育 5000 娱乐 5000 游戏 5000 每个新闻栏目拥有5000条新闻,通过对新闻内容作为样本训练模型,使得该模型能够预测出该条新闻所属的栏目。
2019-12-21 20:19:49
66.03MB
文本分类数据集
1
新闻类
中文文本分类数据集
资源为新闻类的
中文文本分类数据集
,能够满足机器学习,文字分析方面的需求
2019-12-21 18:56:23
61.06MB
11
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
非线性本构关系在ABAQUS中的实现.pdf
scratch版 我的世界.sb2
基于YOLOV5的车牌定位和识别源码.zip
2010年-2020中国地面气候资料数据集(V3.0)
大学生网页设计大作业-5个网页设计制作作品自己任选
中国地面气象站观测数据2000-2021
航迹融合算法MATLAB仿真程序
基于VMD算法的信号降噪.rar
韦来生《数理统计》课后习题与答案
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
基于MQ2烟雾传感器的STM32F103程序
java-spring-web-外文文献翻译40篇.zip
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
基于OpenCV的车牌号码识别的Python代码(可直接运行)
最新下载
TMS320F2812在电力系统多通道同步交流采样中的应用
OpenCV视觉库易语言模块
相机标定工具.rar
思科模拟器7.1PacketTrace7.1最新版本
Mathematical physics - A modern introduction to its foundations_Sadri Hassani
Coppelia Sim (v-REP)仿真 机器人3D相机手眼标定与实时视觉追踪 (一)
MKL 求解大型稀疏复数矩阵
华农java通讯录系统
Word文档内容搜索器2.0.rar
华中科技大学-计算机组成原理-educoder Logisim-储存系统设计(HUST) 答案代码
其他资源
学生成绩管理系统(PHP + MYSQL)
操作系统实验汇总(MFC界面)
Mqtt通讯客户端和服务端代码
基于51单片机的4路智能抢答器
CMMI3访谈问题库及答案
eil51.tsp.txt
C#解线性方程组源代码
金融项目接口测试用例
小波变换去除心电基线漂移
MATLAB R2014b 许可协议文件
C#串口及网络调试工具winform带源码
智能电饭煲程序
学习 FPGA 书籍分享
长沙市道路数据1.zip
PXC3100.pdf
知豆:纯电动汽车整车控制系统培训.pdf
React-ToDoList-源码
ISO/IEC 17021 合格评定-管理体系审核认证机构要求 - 最新及最完整的英文版集合(12个文件/70M)
powerdesigner 数据库 完美 简结 报表模板(正式)
Egret List嵌套
AB LogixStudio5000 SFC和ST手册
HTK嵌入式ARM移植步骤
数据结构算法二叉树实现