只为小站
首页
域名查询
文件下载
登录
互联网评论数据集 (已划分)
适用于中文中长文本分类 原始数据集和已经划分的数据集已给出 划分的数据集经过数据预处理,删除了其中的重复文本,以及文本长度小于50的句子,最终构造的平衡语料 训练集 5800 测试集 1000条 验证集1000 (正负评论各站一半)
2023-01-15 11:06:10
3.33MB
自然语言处理
文本分类
中文文本分类数据集
1
toutiao-text-classfication-dataset.zip
中文文本分类数据集
合
2021-12-16 22:17:00
76.88MB
中文文本分类数据集
复旦大学
中文文本分类数据集
.rar
复旦中文文本数据集,包含训练集与测试集,数据集为TXT格式,可以进行文本分类实验,机器学习,深度学习,需要的可以下载。
2021-06-26 20:27:01
142.08MB
复旦数据集
文本分类
中文数据集
1
网易新闻数据,用于中文文本分类,已经打好标签且预处理好了
有24000条新闻,共六个类别,直接用python3的pickle.load()该文件即可,是一个24000个元素的list,list的每个元素是一个tuple,tuple的第一个元素是与处理好的文本,第二个元素是对应的标签。
2021-06-18 17:50:09
66.9MB
文本分类
自然语言处理
中文文本分类
数据集
1
cnews
中文文本分类数据集
cnews
中文文本分类数据集
;由清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史 数据筛选过滤生成,训练过程见我的博客;
2021-06-02 20:25:12
42.97MB
cnews
深度学习
数据集
1
复旦大学
中文文本分类数据集
-训练+测试
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-25 11:15:53
103.28MB
数据集
中文语料库
1
复旦大学
中文文本分类数据集
本语料库由复旦大学李荣陆提供。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ 密码:dq9m 使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-21 20:24:05
106.17MB
中文文本分类
数据集
1
中文文本分类数据集
.zip
新闻栏目中文文本分类,新闻栏目一共有: 体育 5000 时政 5000 房产 5000 家居 5000 财经 5000 时尚 5000 科技 5000 教育 5000 娱乐 5000 游戏 5000 每个新闻栏目拥有5000条新闻,通过对新闻内容作为样本训练模型,使得该模型能够预测出该条新闻所属的栏目。
2019-12-21 20:19:49
66.03MB
文本分类数据集
1
新闻类
中文文本分类数据集
资源为新闻类的
中文文本分类数据集
,能够满足机器学习,文字分析方面的需求
2019-12-21 18:56:23
61.06MB
11
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
IEEE 39节点系统的Simulink模型
全国河流水文站坐标.xls
基于YOLOV5的车牌定位和识别源码.zip
知网情感词典(HOWNET)
opcua服务器模拟器+opcua客户端工具.rar
2020年数学建模B题(国二)论文.pdf
scratch版 我的世界.sb2
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
MAC OS.X.10.8.iso 镜像文件
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
ChinaMeteorologicalDataHandler.R
上帝之眼和拾荒者.rar
大学生网页设计大作业-5个网页设计制作作品自己任选
最新下载
ME909S-821 Linux驱动及说明
MIPI csi-2 协议
上海贝尔MSA2K-3513NA Openwrt固件,带breed web,可以随心刷三方固件
外挂无间道驱动版-内存写入监视器-做外挂必备
基于DCT变换的数字水印算法.zip
精臣打印机SDK 安卓 IOS PC
GWLauncher:激战和激战 2 的启动器应用程序-开源
Dirac量子力学原理
Delphi superobject
机动车合格证管理信息系统4.1光盘(含C#,Delphi,Java,.NET例子)part3
其他资源
Python - Flask 使用Ajax 实现多文件上传
vdbench50406
stm32贪吃蛇TFT显示
组态王液位控制
android sipdroid源码
gh0st3.6_已去硬盘锁_20210202_VS2017编译通过_注意杀毒软件.rar
数据库课程设计(学生成绩管理系统)
matlab 避障路径
数据库课程设计 报刊订阅系统
mern-auth:具有MERN堆栈的LoginAuth应用程序-源码
云计算技术与应用赛题库解读-20190506.doc
RS 70 100 130 M 20042322&4401&4402.pdf
jsignature.js
日常工作常用js工具类
基于机器视觉的停车位检测技术的研究
PCNN去噪
详细讲解fpga硬件电路设计设计方法进阶,对应潘松verilogHDL第五版,硬件电路从中级到高级设计。
OMG“元对象机制”详细解读,英文原版
mybatis-generator-core-1.3.2.rar
Rocket Dock / Object Dock Tray 系统托盘图标
ADAMS实例教程(ADAMS)