心理健康数据集 下面的信息是一个不断发展的数据集列表(主要来自电子/社交​​媒体),这些数据集已用于对心理健康现象进行建模。 原始数据(带有其他列)可以在data_sources.xlsx找到。 如果您是其中任何一篇论文的作者,并且觉得任何内容都被虚假陈述,请随时通过与我。 有关现有数据集的概述,请考虑阅读我们的论文 。 @inproceedings{harrigian2020state, title={On the State of Social Media Data for Mental Health Research}, author={Harrigian, Keith and Aguirre, Carlos and Dredze, Mark}, booktitle={Proceedings of the 7th Workshop on Computational L
2021-12-24 20:05:56 372KB Python
1
Zomato餐厅数据集 这是一个仪表板创建项目。我分析并可视化了Zomato餐厅的数据集,并以图表和视觉图形的形式展示了有意义的数据。
2021-12-20 10:42:32 2.11MB
1
这本书基于两门斯坦福大学计算机科学专业的课程: CS246 和 CS35A。它的受众为计算机专业的本科学生,不需要任何基础(高中数学学好即可)。剑桥大学出版社出版。译本名为《大数据:互联网大规模数据挖掘与分布式处理》。 This book evolved from material developed over several years by Anand Rajaraman and Jeff Ullman for a one-quarter course at Stanford. The course CS345A, titled “Web Mining,” was designed as an advanced graduate course, although it has become accessible and interesting to advanced undergraduates. When Jure Leskovec joined the Stanford faculty, we reorganized the material considerably. He introduced a new course CS224W on network analysis and added material to CS345A, which was renumbered CS246. The three authors also introduced a large-scale data-mining project course, CS341. The book now contains material taught in all three courses.
2021-12-17 21:10:35 2.62MB Massive Data
1
时空数据集 收集时空数据集以用于网络科学,深度学习和通用机器学习研究。 内容 匈牙利的水痘病例 描述 匈牙利每周水痘(儿童疾病)病例的时空数据集。 该数据集由一个县级邻接矩阵和2005年至2015年之间的县级报告病例的时间序列组成。有两个特定的相关任务: 县级病例数预测。 国家一级的病例数预测。 链接 特性 导演:没有。 节点功能:是。 时间的:是的。 匈牙利县 节点数 20 边缘 61 密度 0.3211 传递性 0.4134 可能的任务 计数数据回归 引用 @misc { rozemberczki2021chickenpox , title = { {Chickenpox Cases in Hungary: a Benchmark Dataset for Spatiotemporal Signal Processing with Graph Neural
1
简介 本数据集为目前已知最大的人像matting数据集,包含34427张图像和对应的matting结果图。 数据集由北京玩星汇聚科技有限公司高质量标注,使用该数据集所训练的人像软分割模型已商用。 数据集中的原始图片来源于Flickr、百度、淘宝。经过人脸检测和区域裁剪后生成了600*800的半身人像。 clip_img目录为半身人像图像,格式为jpg;matting目录为对应的matting文件(方便确认matting质量),格式为png,您训练前应该先从png图像提取alpha图。例如使用opencv可以这样获得alpha图: in_image = cv2.imread('png图像文件路径', cv2.IMREAD_UNCHANGED) alpha = in_image[:,:,3] 下载地址 链接: 提取码:dzsn other url: 数据集截图 matting图: 手机端视频人
2021-12-06 10:43:31 21.7MB
1
完整 AR 人脸数据集 126 people (over 4,000 color images). Different facial expressions, illumination conditions and occlusions.
2021-12-05 17:42:16 29.86MB AR face 数据库
1
bmp格式的retinal datasets,bmp格式的视网膜数据集!
2021-11-28 13:51:21 398.73MB bmp视网膜数据集
1
更新的数据集列表(包含在Google Earth Engine中) 想法是使该列表计算机可读,以便您可以基于过滤器以编程方式调用资产,并为尚未注册但想要查看Earth Engine中的数据集列表的用户提供一个列表。 注册一个免费的。 数据集生成为始终更新的JSON文件以及具有以下设置的CSV文件 ID 提供者 标题 开始日期 结束日期 开学年 年终 类型 标签 asset_url thumbnail_url AAFC / ACI 加拿大农业和农业食品 加拿大AAFC年度作物清单 2009-01-01 2021-03-08 2009年 2020年 image_collection aafc,加拿大,庄稼,土地覆盖 该列表允许将数据集构建到解析器中,我们可以像应用字典一样在应用任何其他工具之前提取它们。 地球引擎工具 :此工具已经开发了许多迭代,以将其他功能与Google
2021-11-25 11:42:03 61KB dataset earth-engine
1
微博公众意见数据集 不断更新新浪微博舆论数据集(仅用于研究) 更新:一站式科研数据服务平台已全面启动!! 只需单击几下即可实现数据采集,数据分析和数据应用。 欢迎尝试与合作 :clapping_hands: :clapping_hands: :clapping_hands: 介绍 新浪微博是中国最大的公共社交媒体平台。 最新和最受欢迎的社交活动将尽快在微博上公开和讨论。 因此,建立一个实时,全面的微博舆情数据集具有重要意义。 目前,在给定指定关键词和指定期限的情况下,微博推文数据集的构建方法有两种:(1)应用微博提供的高级搜索API; (2)遍历所有微博用户,收集指定时间段的所有推文,然后使用指定的关键字过滤推文。 但是,对于第一种方法,由于微博搜索API的限制,一次搜索的结果最多包含1000条推文,这使得构建大型数据集变得困难。 至于第二种方法,尽管我们可以构建几乎没有遗漏的大规模数据集,但是遍历数十亿微博用户需要非常长的时间和大量的带宽资源。 另外,大量的微博用户
2021-11-23 20:05:20 447KB
1
camvid数据集,只包含11 classes: sky, building,column pole, road, sidewalk, tree, sign symbol, fence, car,pedestrian, and bicyclist. 天空、建筑物、柱子、道路、人行道、树、标志符号、栅栏、汽车、行人和自行车,转自:https://aistudio.baidu.com/aistudio/datasetdetail/65991/0
2021-11-17 20:08:03 570.51MB ImageSegmentati
1