CycleGAN-VC3-PyTorch | 该代码是PyTorch的纸上实现: ,这是有关语音转换/语音克隆的工作。 数据集 风投 用法 训练 例子 演示版 参考 循环GAN-VC3 非并行语音转换(VC)是一种无需使用并行语料库即可学习源语音和目标语音之间的映射的技术。 最近,CycleGAN-VC [3]和CycleGAN-VC2 [2]在此问题上已经显示出令人鼓舞的结果,并已被广泛用作基准测试方法。 但是,由于CycleGAN-VC / VC2对mel谱图转换的有效性不明确,即使比较方法采用mel谱图作为转换目标,它们也通常用于mel-cepstrum转换。 为了解决这个问题,我们研究了CycleGAN-VC / VC2对梅尔谱图转换的适用性。 通过初步实验,我们发现它们的直接应用损害了在转换过程中应保留的时频结构。 为了解决这个问题,我们提出了CycleGAN-V
2022-03-24 20:29:51 388KB pytorch gan voice-conversion cyclegan
1
一款可以发送调皮语音的微信
2022-02-08 23:43:04 23.96MB 微信 语音转换
1
将文本转换成语音,采用微软提供的TTS引擎技术
2022-01-09 23:14:19 27.61MB TTS实例
1
语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本?如何使用 SpeechRecognition 库在 Python 中将语音转换为文本?我们不需要从头开始构建任何机器学习模型,该库为我们提供了各种著名的公共语音识别 API 的便捷包装。 使用 pip 安装库: pip3 install SpeechRecognition Okey,打开一个新的 Python 文件并导入它: import speech_recognition as sr 从文件读取 确保当前目录中有一个包含英语语音的音频文件 (如果您想跟我一起学习,请在此
2021-12-31 21:52:44 50KB 方法
1
屏蔽循环GAN-VC 非官方的PyTorch Kaneko等人的MaskCycleGAN-VC模型的非并行语音转换的实现。 MaskCycleGAN-VC是使用CycleGAN进行非并行语音转换的最新方法。 通过将临时蒙版应用于输入梅尔谱图,使用新颖的填充帧辅助任务(FIF)对它进行了训练。 论文: : 资料库贡献者: , , 设置 克隆存储库。 git clone git@github.com:GANtastic3/MaskCycleGAN-VC.git cd MaskCycleGAN-VC 创建conda环境。 conda env create -f environment.yml conda activate MaskCycleGAN-VC VCC2018数据集 本文的作者使用了的Spoke任务中的数据集。 这是来自6位男性和6位女性说话者的非平行话语的数据集。
2021-12-30 14:35:02 31KB Python
1
适用于Java的Vonage Server SDK 您可以使用此Java Server SDK将添加到您的应用程序。 要使用此功能,您需要一个Vonage帐户。 注册。 安装 要使用Java Server SDK,您需要。 Gradle 要使用Gradle安装Java Server SDK,请在build.gradle添加以下build.gradle : repositories { mavenCentral() } 对于Gradle 3.4或更高版本: dependencies { implementation ' com.vonage:client:6.2.0 ' } 对于旧版本: dependencies { compile ' com.vonage:client:6.2.0 ' } 玛文 将以下内容添加到项目的POM文件中的正确位置: < d
2021-12-14 15:10:26 592KB java verify authentication dtmf
1
加权自适应实例归一化的一键式语音转换 ,*,*,,( 。 此仓库是的正式实现。 音频样本可在。 依存关系 python 3.6.0 pytorch 1.4.0 pyyaml 5.4.1 numpy的1.19.5 librosa 0.8.0 声音文件0.10.2 tensorboardX 2.1 预处理 在运行此项目之前,您需要先准备什么以及如何准备它们 我们使用作为声码器,并使用作为数据集。 如果您想运行我们的项目,请首先按照ParallelWaveGAN项目的说明进行安装。 然后像ParallelWaveGAN一样准备所有的Mel谱图数据。 准备speaker_used.json自己的文件,如./data/80_train_speaker_used.json和./data/fine_tune_speaker_used.json表演。 通过运行./convert
2021-11-20 20:51:56 15.43MB Python
1
闪电文字语音转换软件是一款AI智能产品,支持导入文本或输入文字转换成音频、也可以将音频文件转换识别成文字,是支持多种语音类型、多种输出格式、调节语音语速、音量、音调
2021-11-15 10:23:07 33.63MB 闪电文字语音转换软件 v2.2.8官方版
1
语音变压器 介绍 这是语音变压器的PyTorch重新实现:用于语音识别的无重复序列到序列模型。 数据集 Aishell是由北京壳牌壳牌科技有限公司发行的开源中文普通话语料库。 邀请了来自中国不同口音地区的400人参加录音,该录音是在安静的室内环境中使用高保真麦克风进行的,并下采样至16kHz。 通过专业的语音注释和严格的质量检查,手册的转录准确性达到95%以上。 数据免费供学术使用。 我们希望为语音识别领域的新研究人员提供适度的数据。 @inproceedings{aishell_2017, title={AIShell-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition Baseline}, author={Hui Bu, Jiayu Du, Xingyu Na, Bengu Wu, Hao Z
2021-11-08 14:53:56 1.03MB Python
1
jave-1.0.3.jar解决已知如下问题: 1、it.sauronsoftware.jave.EncoderException: Metadata 2、it.sauronsoftware.jave.EncoderException: video:0kB audio:1301kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.019516% 测试环境:jdk8 、 Windows10 x64 、 Linux x64 测试内容: wav转mp3 、amr转mp3 说明:此版本完美通过测试 转换过程无异常 均成功生成mp3文件 播放正常
2021-10-30 17:27:11 15.05MB Jave语音转换 mp3 wav等互转 ffmpeg
1