该站点展示了从我们的研究型无人机(UAV)平台收集的数据集,这些数据集具有大量传感器: 两个3D激光雷达 两个时间同步摄像机 多个惯性测量单元(IMU) UAV上的四个超宽带(UWB)节点,范围为三个锚点。 全面的传感器套件类似于自动驾驶汽车的传感器套件,但具有空中操作独特且具有挑战性的特征。 飞行测试是在各种室内和室外条件下进行的。 引文 如果您使用此数据套件中的某些资源,请引用为 @article{nguyen2021ntuviral, title={NTU VIRAL: A Visual-Inertial-Ranging-Lidar dataset, from an aerial vehicle viewpoint}, author={Nguyen, Thien-Minh and Yuan, Shenghai and Cao, Muqing and Lyu, Yang
2025-10-30 16:24:16 6.95MB SCSS
1
在计算机视觉和机器学习领域,数据集的构建是至关重要的一步,它直接影响模型的训练效果和应用性能。YOLO(You Only Look Once)是一种流行的目标检测算法,广泛应用于实时视频对象识别和工业图像分析。为了训练YOLO模型,需要大量的标记好的数据集。而Unity作为一款广泛使用的3D游戏引擎和实时模拟平台,能够创建复杂场景和对象,这使得它非常适合用于制作仿真环境下的训练数据集。 专门用于制作YOLO格式数据集的Unity脚本,可以自动化地在Unity环境中对模型进行训练所需的对象进行标记。这些脚本通常包括了在场景中放置预定义对象、调整对象角度和位置、以及为对象生成标注信息等功能。此外,这些脚本可能还会具有随机化场景元素的参数,例如光照、天气、遮挡等,以模拟真实世界中可能出现的各种情况,从而提高模型的泛化能力。 这些脚本的开发通常需要深入理解Unity引擎的API以及YOLO数据格式的具体要求。YOLO数据集由多个部分组成:图片文件、标注文件和类的定义。标注文件记录了每个物体在图片中的位置和类别信息,通常为文本文件,其中包含了物体的类别ID和包围框的坐标信息。 为了使数据集更加丰富和多样,这些脚本可以实现多种功能,比如自动调整物体的大小、形状、纹理等,以及自动将这些变化同步到标注文件中。这样,数据集的创建者可以在不直接修改标注文件的情况下,快速生成大量不同配置的对象样本。此外,还可能包括数据集划分功能,将数据集分为训练集、验证集和测试集,以符合机器学习的工作流程。 在实际应用中,使用这样的脚本可以大幅提高数据集制作的效率,缩短从构思到实施的时间,这对于需要快速迭代模型的开发者而言是极为有利的。此外,对于初学者而言,这样的脚本可以让他们更加专注于理解YOLO算法本身,而不是在数据收集和标注上消耗过多的时间和精力。 计算机视觉领域的研究和应用不断推进,对于高质量、大规模的标注数据集的需求日益增长。因此,能够自动或半自动化生成符合特定格式要求的数据集的Unity脚本,对于推动算法的发展和实际应用的落地具有重要意义。通过这些脚本,研究人员和工程师能够以更快的速度测试和改进他们的模型,最终达到提升模型准确率和适用性的目的。
2025-10-17 16:58:47 3KB
1
学生行为StudentBehavior​​Dataset 数 据 集共1810张学生课堂 图像,包括“ Focused 专注听讲”、“ Reading 阅读 ”、“ Hand Movement 手部动作 ”、 “ Head Down 低头 ”、 “ Looking Aside 侧视 ”和“ Sleeping 睡觉 ” 等六种 类型,每张图像 的大小为640像素x640 像素。图像数据集划分为1268 张图像作为训练集,361 张图像作为验证集,181张图像作为测试集。
2025-10-12 20:55:00 561.5MB 数据集
1
糖尿病临床数据集(10万行) 用于预测建模和健康分析的100000糖尿病数据集 关于数据集 详细的数据集,包括100000人的健康和人口统计数据,旨在促进糖尿病相关研究和预测建模。该数据集包括性别、年龄、地点、种族、高血压、心脏病、吸烟史、BMI、HbA1c水平、血糖水平和糖尿病状态等信息。 数据集用例 该数据集可用于各种分析和机器学习目的,例如: 预测建模:根据人口统计和健康相关特征构建模型来预测糖尿病的可能性。 健康分析:分析不同健康指标(如BMI、HbA1c水平)与糖尿病之间的相关性。 人口统计学研究:检查糖尿病在不同人口群体和地点的分布。 公共卫生研究:识别糖尿病的风险因素,并针对高危人群进行干预。 临床研究:研究高血压等合并症与糖尿病合并心脏病之间的关系。 潜力分析 描述性统计:总结数据集,了解特征的中心趋势和分散性。 相关性分析:识别特征之间的关系。 分类模型:使用机器学习算法将个体分类为糖尿病患者或非糖尿病患者。 趋势分析:分析多年来的趋势,看看糖尿
2025-10-12 12:35:15 1.14MB dataset
1
免费的东东,官网可以下到,以防网断掉,或者大家找不到,传一份上来。包括100k和1m两个,另外10m的太大,不传了,想要的自己去下吧
2025-10-12 12:26:00 10.4MB movieLens DataSet 1m,100k
1
ISRUC-SLEEP Dataset公开数据集是一个专门用于睡眠研究的医学数据集,它包含了大量的心电图(ECG)信号记录,这些记录被专业人员手工标注了R点。R点是心电图中一个非常重要的特征点,它代表了心脏每次搏动时的电位峰值,通过分析这些R点可以帮助研究者和医生评估心率变异性(HRV)等相关的心脏健康指标。心率变异性是指心跳间期(相邻R波峰的时间间隔)的微小变化,它是反映自主神经系统活动的一个重要指标,尤其是评估心脏对于压力和其他外部刺激的适应能力。 在ISRUC-SLEEP Dataset中,手工标注的R点文件提供了108条数据记录,这些记录大多数是健康睡眠中的ECG信号。数据集的开发人员为了保证标注的质量,对那些数据质量太差无法准确标注的记录进行了剔除。通过这样的方法,保证了数据集的标注精度和研究的有效性。 由于这些数据涉及到个人的医疗健康信息,因此在使用时需要严格遵守相关的隐私保护法律法规。此外,这些数据不仅可以用于研究心率变异性,还可以用于其他医学研究,比如睡眠障碍的诊断、心律失常的检测等。数据集的高精度和代表性使其成为了一个非常有价值的医学研究资源。 R点的精确标注对于心电图的分析至关重要,因为它直接关系到后续的心率变异性分析质量。心率变异性分析技术能够为临床诊断提供定量的生理学信息,比如在评估心血管疾病的患病风险以及监测糖尿病患者的自主神经系统变化等方面具有重要应用价值。同时,对于睡眠医学领域,心率变异性也是研究睡眠质量和睡眠结构的重要参数之一。 ISRUC-SLEEP Dataset公开数据集中的ECG信号手工标注R点文件不仅为心率变异性的研究提供了一套可靠的数据资源,也对改善睡眠质量和监测心脏健康具有潜在的应用价值。研究人员和医生可以使用这些数据来开发更加精准的诊断工具,或者进行更有深度的临床研究。
2025-10-10 02:34:34 8.06MB
1
rgbd-dataset-freiburg1-desk
2025-10-05 17:09:56 371.73MB rosbag
1
适合用于composition任务中为合成物体添加阴影,或者阴影检测、去除等任务。一组数据包含有阴影、无阴影、阴影mask、实例mask等
2025-09-15 17:42:17 861.6MB 机器学习 图像复原
1
《CWRU轴承故障数据集详解与应用》 CWRU轴承故障数据集,全称为Case Western Reserve University轴承故障数据集,是国际上广泛应用于滚动轴承健康状态监测和故障诊断研究的重要数据资源。该数据集由美国凯斯西储大学的研究团队精心采集,包含了轴承在不同工况下运行时的振动信号,旨在为学者、工程师和研究人员提供一个真实、全面的实验平台,用于开发和验证滚动轴承故障检测和预测的算法。 一、数据集概述 CWRU轴承故障数据集主要包括了四种类型的故障模式:正常运行、内圈故障、外圈故障和滚珠故障。每个故障模式下,都记录了轴承在不同转速下的振动信号,转速范围通常从1200到7200 RPM,涵盖了工业应用中常见的工作条件。此外,数据集还提供了相应的时域和频域分析结果,便于用户进行信号处理和特征提取。 二、数据采集与处理 数据采集过程中,采用了加速度传感器对轴承的径向振动进行实时监测,确保了数据的实时性和准确性。采集到的原始数据经过预处理,包括滤波、降噪和采样率转换等步骤,转化为适合分析的时域信号。这些处理后的信号可以用于后续的特征提取和故障识别。 三、Matlab程序辅助分析 为了方便研究人员进行数据分析,CWRU轴承故障数据集附带了Matlab程序,可用于绘制时域和频域的故障数据。这些程序可以帮助用户快速理解数据特性,进行时域分析(如均值、峰值、峭度等)、频域分析(如傅立叶变换、功率谱密度等)以及特征参数提取(如峭度、峭直度、冲击能量等)。 四、故障诊断与预测 通过对CWRU轴承故障数据集的深入分析,可以识别出不同故障模式下的特征,从而发展出针对轴承故障的诊断和预测模型。常见的方法有基于统计的特征选择、机器学习算法(如支持向量机、随机森林等)以及深度学习网络(如卷积神经网络、长短时记忆网络等)。 五、实际应用与挑战 虽然CWRU轴承故障数据集在理论研究和工程实践中具有很高的价值,但其应用也面临着一些挑战,例如信号的非线性、非平稳性,以及噪声干扰等。因此,如何从复杂的振动信号中准确提取故障特征,提高诊断精度,是当前研究的热点问题。 CWRU轴承故障数据集是研究滚动轴承故障诊断技术的重要工具,对于提升机械设备的维护水平,实现预测性维护,降低生产成本,保障工业生产安全具有深远意义。通过深入研究这个数据集,我们可以不断优化和完善轴承故障诊断的算法,推动工业自动化和智能化的发展。
2025-09-14 20:27:25 226.07MB 轴承数据集 CWRU
1
欺诈检测在银行行业中是一项至关重要的任务,因为它直接影响到金融机构的安全和客户的信任。这份"Fraud detection bank dataset 20K records binary.zip"压缩包提供了一个专门用于欺诈检测的银行交易数据集,包含了20,000条记录,数据以二进制格式存储。主要的文件名为"欺诈检测银行数据集.csv",它很可能包含了一系列与银行交易相关的特征和标签,用于训练和评估欺诈检测模型。 我们需要理解这个数据集的基本结构。CSV(Comma Separated Values)文件是一种常见的数据存储格式,通常用于表格数据,每行代表一个样本,列则对应不同的特征或变量。在这个案例中,数据集可能包含以下几类关键信息: 1. **时间戳(Timestamp)**:每一笔交易的时间,这对于检测异常行为至关重要,因为欺诈交易往往在特定时段集中出现。 2. **交易金额(Amount)**:交易涉及的金额大小,欺诈交易可能具有异常的大额或小额特征。 3. **用户ID(Customer ID)**:参与交易的客户标识,通过分析用户的交易模式,可以识别出不寻常的行为。 4. **交易类型(Transaction Type)**:如购买、退款、转账等,不同类型的交易可能有不同的欺诈风险。 5. **地理位置信息(Location Information)**:包括交易发生地的经纬度或城市,可以帮助识别异地交易或其他不寻常的位置模式。 6. **商户信息(Merchant ID)**:与商家关联的信息,某些商家可能更容易成为欺诈的目标。 7. **标签(Label)**:这是二分类问题,每个样本会有一个标签(0或1),表示该交易是否为欺诈。0通常代表正常交易,1代表欺诈交易。 在处理这个数据集时,我们可能需要进行预处理步骤,包括缺失值处理、异常值检测、特征编码(如类别变量的独热编码)以及标准化或归一化数值特征。之后,可以应用各种机器学习算法,如逻辑回归、支持向量机、决策树、随机森林、梯度提升机或者现代的深度学习模型,如神经网络,来进行欺诈检测。 模型训练后,我们需要使用交叉验证来评估模型性能,常用的指标有准确率、召回率、F1分数和AUC-ROC曲线。高召回率意味着模型能够有效地找出大部分欺诈交易,而高准确率则表明模型误报的情况较少。在实际应用中,通常会更注重降低假阳性(误报正常交易为欺诈)以减少对正常客户的打扰。 根据模型的表现,我们可以进行特征重要性分析,了解哪些特征对欺诈检测最为关键,以便优化模型或改进业务流程。同时,持续监控和更新模型以适应欺诈手段的变化也非常重要。 这个数据集为研究和开发银行欺诈检测系统提供了丰富的资源。通过深入分析和建模,我们可以更好地理解和预防金融欺诈,保障银行系统的稳定和客户的财产安全。
2025-09-14 11:50:19 738KB
1