双信号转换LSTM网络 Tensorflow 2.x实施的堆叠式双信号转换LSTM网络(DTLN)用于实时噪声抑制。 该存储库提供了用于在python中训练,推断和服务DTLN模型的代码。 它还提供了SavedModel,TF-lite和ONNX格式的预训练模型,可用作您自己的项目的基准。 该模型能够在RaspberryPi上运行实时音频。 如果您正在使用此仓库做一些有趣的事情,请告诉我。 我总是对您使用此代码或该模型所做的事情感到好奇。 DTLN模型已提交给深度噪声抑制挑战( ),并在INTERSPEech 2020上发表。 这种方法在少于一百万个参数的堆叠网络方法中结合了短时傅立
2021-11-15 17:08:30 29.86MB audio raspberry-pi deep-learning tensorflow
1
高可用实时语音系统.pdf
2021-10-14 16:02:58 2.68MB 解决方案
实时语音对讲机,在Android上测试可用,通过蓝牙2.4G频段收发数据,实时对讲效果好,可以直接使用,也可以根据项目需求,在蓝牙实时语音对讲机的基础上做二次开发,也可以供初学者入门.zip,太多无法一一验证是否可用,程序如果跑不起来需要自调,部分代码功能进行参考学习。
2021-10-11 17:42:48 941KB wifi蓝牙
1
代码能够实现实时录音,并加高斯噪声,实现强制去噪,硬阈值,软阈值,默认阈值小波去噪
1
实时语音克隆 该存储库是使用实时工作的声码器实现的(SV2TTS)的实现。 如果您好奇或正在寻找我未记录的信息,请随时检查。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。 视频演示(单击图片): 已实施文件 网址 指定 标题 实施源 SV2TTS 将学习从演讲者验证转移到多演讲者语音合成 这个回购 WaveRNN(声码器) 高效的神经音频合成 Tacotron 2(合成器) 基于梅尔谱图预测的条件波网自然合成TTS GE2E(编码器)
2021-10-01 07:30:19 955KB python deep-learning tensorflow pytorch
1
行业分类-网络游戏-基于异构移动IP网络的实时语音对讲系统.zip
我实现局域网内实时的语音通信,欢迎下载!
2021-09-03 16:05:12 4.21MB VC++语音通信
1
UnityRTC 基于webrtc的unity多人游戏实时语音(基于WEBRTC的Mutiplayer中Impl实时游戏语音的Unity演示) 简介 MutiRTC_Unity unity工程,基于版本5.3.3f1。包含一个简单的多人实时语音聊天室场景。语音模块以平台sdk形式集成进统一,包括安卓和ios的语音sdk,详见插件目录。可支持多人视频(videotrack)和文字聊天(datachannel),暂时屏蔽了 支持功能: 多人同时在线聊天:由于基于webrtc的p2p连接,每两个人之间都有一个同伴连接,只能少数几人互通,否则性能会有问题 支持android和ios 语音扬声器模式与
2021-08-24 11:27:00 26.71MB sdk unity webrtc realtime
1
行业分类-物理装置-一种复杂噪声场景下的实时语音段落追踪方法.zip
文中阐述的是家庭监护机器人项目中语音识别系统设计的部分,通过DSP、DMA和ARM Cortex-A8的并行处理,利用双缓冲的方法,在嵌入式Linux上实现了基于ATK的实时语音识别系统。文中对该系统的软硬件进行了设计。在硬件方面,给出语音识别系统的硬件组成原理,并提供了关键部分原理图;在软件方面,提出实时语音识别的方法,给出应用程序实现流程。最后通过真人说话来进行语音识别实验,实时语音识别率达到了94.67%以上,实验验证了系统的软件硬件设计的正确性。
1