它将包含大约80K个记录,涵盖来自北美、中南美洲和欧洲的1500到2000个物种。这是目前最大的生物声学数据集, 它将包含大约80K个记录,涵盖来自北美、中南美洲和欧洲的1500到2000个物种。这是目前最大的生物声学数据集,
2022-12-22 18:31:13 796.24MB 声音 动物 数据集 深度学习
人的声音数据集,采集了4k的音频样本,从男性声音中采集了2k个样本从女性声音中采集了2k个样本然后我生成了所有这些样本的光谱图。图像的命名惯例是,名称的第一部分显示样本是来自男性声音还是女性声音。标签0用于女性声谱图,1用于男性声谱图。
2022-12-18 18:28:43 261.78MB 声音 数据集 男女
基于Keras+python实现的声纹识别系统完整源码(可训练和测试)+带数据集+训练好的模型+项目说明.7z 【项目】基于深度学习的声纹识别 【主要功能】 通过声音识别人物 实现原理(流程): 音频 → 提取语音特征(FFT、Mel过滤、MFCC)→ CNN&GRU → Triplet loss损失函数训练 + 预训练 + 训练得结果
2022-12-14 16:26:54 838.53MB 声音识别 python源码 keras源码 MFCC
linux下C语言的程序,可以实现ALSA架构的声音采集,并且生成wav格式的音频文件,实现播放的功能。
2022-12-13 11:17:47 30KB linux alsa
1
紧急车辆警报器声音数据集,该数据集由长度为3秒的波形音频文件组成。它们包含紧急车辆-救护车和消防车的警报声。第三个类别叫做Traffic,它包含3秒的.wav格式的纯交通声音音频文件。每个类别包含200个声音文件,每个音频文件的200个声谱图图像,以及用于将每个音频文件转换为声谱图的python脚本。
2022-12-12 11:28:36 281.76MB 数据集 深度学习 紧急车辆 警报器
该数据集包含一个基于康奈尔鸟叫声识别数据集的Mel光谱图训练的ResNet-34模型。它可以用于从音频剪辑中识别鸟类的种类,具有很高的准确性(在未看的剪辑中约55%),涵盖了264个不同的物种声音
2022-12-11 11:27:16 78.08MB 数据集 声音 鸟叫 深度学习
1000个女性声音样本的HND, ENG和GU语言。语音样本的长度为3至8秒。该数据集用于语音性别识别系统。 1000个女性声音样本的HND, ENG和GU语言。语音样本的长度为3至8秒。该数据集用于语音性别识别系统。
2022-12-09 09:30:02 162.6MB 数据集 使声音 女生 样本
8732个带有标签的城市声音数据集,10个类别空调、喇叭、儿童玩耍、狗吠、钻井、发动机空转、枪响、手提钻、汽笛和街头音乐。 8732个带有标签的城市声音数据集,10个类别空调、喇叭、儿童玩耍、狗吠、钻井、发动机空转、枪响、手提钻、汽笛和街头音乐 8732个带有标签的城市声音数据集,10个类别空调、喇叭、儿童玩耍、狗吠、钻井、发动机空转、枪响、手提钻、汽笛和街头音乐
2022-12-09 09:30:00 216.43MB 数据集 城市音乐 声音 深度学习
MSN消息声音 WAV格式 MSN消息声音 WAV格式 MSN消息声音 WAV格式 MSN消息声音 WAV格式
2022-12-08 18:31:08 4KB MSN消息声音 WAV
1
C++免费声音库 使用C#封装,FMod.net 游戏声音库 c#
2022-12-06 15:14:44 776KB FMod.net 游戏声音库 c#
1