分类数据集读入程序,data.h5(https://www.floydhub.com/deeplearningai/datasets/cat -vs-noncat)含209个训练样本与50个测试样本,其中每个样本均为64×64大小的RGB彩色图片。
2020-02-21 03:08:16 1KB 神经网络学习
1
贝叶斯数据集,参考matlab:https://blog.csdn.net/qq_38784454/article/details/79729941
2020-01-03 11:32:05 7KB 贝叶斯分类 数据集
1
该部分为总数据集,该部分为总数据集,该部分为总数据集,该部分为总数据集。
2020-01-03 11:31:59 48.47MB 音乐流派分类 数据集
1
图像分类数据集:17个类别的花朵数据集,训练集800张,验证集和测试集260张
2020-01-03 11:19:16 51.76MB 图像分类 图片分类
1
只有两类label(0,1)的MNIST数据集,应用于二分类问题。
2020-01-03 11:17:24 312KB MNIST数 二分类数据集
1
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-25 11:15:53 103.28MB 数据集 中文语料库
1
SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。
2019-12-21 22:23:09 94.29MB NLP 自然语言处理 文本分类 搜狗
1
该数据集包含了1,600,000条从推特爬取的推文,可用于情感分析相关的训练。 该数据集包含两个数据文件:测试集(test)和训练集(training) 数据文件没有包含heading,从左到右分别是: (1)推文标注(polarity): 0 = 负面,2 = 中立,4 = 正面 (2)推文的id (3)时间:Sat May 16 23:58:44 UTC 2009 (4)Query (lyx),如果没有query,数值为NO_QUERY. (5)发推的用户:robotickilldozr (6)推文内容
2019-12-21 22:23:09 86.3MB 文本分类 自然语言处理 NLP 情感分类
1
美国卡耐基大学垃圾邮件分类数据集,英文,已划分好正负样本。总共有5000多条记录,适合数据挖掘,机器学习中贝叶斯分类模型等应用
2019-12-21 22:20:38 1.72MB 垃圾邮件分类 数据集 数据挖掘
1
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
2019-12-21 22:04:21 101.81MB 文本分类 数据集 复旦 中文
1