1.本项目以科大讯飞提供的数据集为基础,通过特征筛选和提取的过程,选用WaveNet模型进行训练。旨在通过语音的梅尔频率倒谱系数(MFCC)特征,建立方言和相应类别之间的映射关系,解决方言分类问题。 2.项目运行环境包括:Python环境、TensorFlow环境、JupyterNotebook环境、PyCharm环境。 3.项目包括4个模块:数据预处理、模型构建、模型训练及保存、模型生成。数据集网址为:challenge.xfyun.cn,向用户免费提供了3种方言(长沙话、南昌话、上海话),每种方言包括30人,每人200条数据,共计18000条训练数据,以及10人、每人50条,共计1500条验证数据;WaveNet模型是一种序列生成器,用于语音建模,在语音合成的声学建模中,可以直接学习采样值序列的映射,通过先前的信号序列预测下一个时刻点值的深度神经网络模型,具有自回归的特点;通过Adam()方法进行梯度下降,动态调整每个参数的学习率,进行模型参数优化 4.项目博客:https://blog.csdn.net/qq_31136513/article/details/134832627
2025-01-13 20:25:03 16.4MB tensorflow python 深度学习 语音识别
1
【作品名称】:基于 python+深度学习的视觉问答【毕业设计】(含源码+答辩 ppt) 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍】:对于视觉问答(VQA)的研究具有深刻的学术意义和广阔的应用前景。目前,视觉问答模型性能提升的重点在于图像特征的提取,文本特征的提取,attention权重的计算和图像特征与文本特征融合的方式这4个方面。本文主要针对attention权重的计算和图像特征与文本特征融合这两个方面,以及其他细节方面的地方相对于前人的模型做出了改进。本文的主要工作在于本文使用open-ended模式,答案的准确率采用分数累积,而不是一般的多项选择。本文采用CSF模块(包括CSF_A和CSF_B)不仅对spatial-wise进行了权重计算,还对channel-wise进行了权重计算。本文采用MFB模块和ResNet152 FC层之前的tensor来结合LSTM的输出来计算每个区域的权重,而不是直接把image feature和question feature结合本文采用SigMoid来
2024-08-24 15:02:35 2.73MB 毕业设计 python 深度学习
1
1. 数据文件 train.csv 和 test.csv 包含手绘数字的灰度图像,从0到9 2.train.csv 有 label, test.csv 没有 3.每幅图像高28像素,宽28像素,总共784像素 4.每个像素都有一个与之关联的像素值,表示该像素的亮度或暗度,数字越大表示越暗 5.该像素值是0到255之间的整数,包括0和255
2024-08-13 19:43:04 15.25MB 数据集 手写数字识别 python 深度学习
1
给深度学习入门者的python教程,包括常用的numpy和matplotlib的入门知识,简单易懂。
2024-07-24 10:00:00 1.63MB python 深度学习
1
基于深度学习的分类 python代码-基于深度学习的英文文本分类研究 python代码-基于深度学习的英文文本分类研究 python代码-基于深度学习的英文文本分类研究
2024-06-11 09:23:00 533KB python 深度学习
1
Python基于pytorch深度学习的车型识别系统源码+使用说明 训练模型主要分为五个模块:启动器、自定义数据加载器、网络模型、学习率/损失率调整以及训练可视化。 启动器是项目的入口,通过对启动器参数的设置,可以进行很多灵活的启动方式,下图为部分启动器参数设置。 任何一个深度学习的模型训练都是离不开数据集的,根据多种多样的数据集,我们应该使用一个方式将数据集用一种通用的结构返回,方便网络模型的加载处理。 这里使用了残差网络Resnet-34,代码中还提供了Resnet-18、Resnet-50、Resnet-101以及Resnet-152。残差结构是通过一个快捷连接,极大的减少了参数数量,降低了内存使用。
2024-06-06 13:32:59 21KB pytorch pytorch python 深度学习
1
YOLO txt格式的船舶识别数据集,图片数量5000,标签共有10类,类别:['BULK CARRIER', 'CONTAINER SHIP', 'GENERAL CARGO', 'OIL PRODUCTS TANKER', 'PASSENGERS SHIP', 'TANKER', 'TRAWLER', 'TUG', 'VEHICLES CARRIER', 'YACHT']。
2024-05-28 18:14:26 43.95MB 数据集 YOLO Python 深度学习
1
基于LSTM(Long Short-Term Memory)模型的股票预测模型是一个应用深度学习技术来分析和预测股票市场走势的工具。该模型特别适用于处理和预测时间序列数据,能够学习股票价格随时间变化的复杂模式。 此Python资源包含一个完整的LSTM模型实现,适用于金融分析师和机器学习爱好者。它提供了从数据预处理、模型设计、训练到预测的全流程代码。用户可以利用这个模型来提高对股票市场动态的理解,以及对潜在投资机会的把握。 资源中还包含了用于训练模型的示例数据集,以及一个详细的使用教程,指导用户如何配置和运行模型,如何调整超参数以优化预测性能。此外,文档还涉及了模型评估的常用指标,帮助用户了解模型的预测准确性。 使用此模型时,用户应意识到股市存在不确定性,模型预测不能保证投资成功。此外,用户应遵守相关法律法规,合理使用该工具,并尊重数据来源的版权和使用条款。这个资源是金融科技领域探索者和实践者提升技能、深入了解机器学习在金融领域应用的宝贵资料。
2024-05-25 13:26:14 965KB python 深度学习 lstm 数据集
1
Python 深度学习 北京空气质量LSTM时序预测 tensorflow自定义激活函数hard tanh keras tensorflow backend操作 2010.1.2-2014.12.31北京空气雾霾pm2.5 pm10数据集 折线图loss下降趋势预测值真实值对比图 label encoder one hot min max scale 标准化 numpy pandas matplotlib jupyter notebook 人工智能 机器学习 深度学习 神经网络 数据分析 数据挖掘
2024-04-27 15:13:31 453KB Python 深度学习 tensorflow LSTM
1
pytorch-1.4.0-py3.8 cuda101 cudnn7.0
2024-04-12 03:13:21 472.4MB pytorch 人工智能 python 深度学习
1