卡尔迪戈普 该项目使用Kaldi计算基于GMM的GOP(发音优度)。 有关基于DNN的实现的说明 此实现是基于GMM的。 对于基于DNN的实现,请检查Kaldi的官方存储库: GOP-DNN的性能应该比GOP-GMM好得多。 如何建造 ./build.sh 运行示例 cd egs/gop-compute ./run.sh 理论 在传统的基于GMM-HMM的系统中,GOP最早是在(Witt等,2000)中提出的。 它被定义为后验的持续时间标准化对数: $$ GOP(p)= \ frac {1} {t_e-t_s + 1} \ log p(p | \ mathbf o)$$ 其中$ \ mathbf o $是输入观测值,$ p $是规范电话,$ t_s,t_e $是开始和结束帧索引。 假设对于任何$ q_i,q_j $,$ p(q_i)\ p(q_j)$,我们有: $$ \ lo
2021-12-06 13:20:45 15KB speech-recognition kaldi C++
1
最全的kaldi学习指导文档,目前是最新版本。 kaldi是一个开源的语音识别工具箱,是基于c++编写的,可以在windows和unix平台上编译。 1)与文本无关的LVCSR系统; 2)基于FST的训练和解码; 3)最大似然训练; 4)各种各样的线性和映射变换; 5)有VTLN,SAT的脚本;
2021-12-02 20:04:34 2.85MB 语音识别 人工智能 kaldi ubuntu
1
Kaldi用于ivector和xvector的摘要 文件清单 ivector/ conf/ :为mfcc和vad配置文件 wav/ :测试音频(您也可以使用自己的wav路径,请参阅步骤1 ) 仅支持flac(安装flac),wav和sph(安装sph2pipe) model_3000h/ :预训练模型 enroll.sh :主进程enroll.sh data/ :保存提取的特征(已生成文件) utt2spk, wav.scp通过make_data.py生成两个文件 spk2utt :从utt2spk生成 log/ :保存所有日志 tmp/ :保存所有tmp文件 xvector/ c
2021-11-28 10:50:23 550KB python shell kaldi xvector
1
语音识别搭建,kaldi全部资料
2021-11-26 16:44:41 3.35MB kaldi
1
kaldi安装所需
2021-11-09 17:01:23 376KB cub kaldi
1
openfst-1.7.2
2021-11-09 17:01:22 1.21MB openfst kaldi
1
拿到树莓派后首先刷入系统,在官方网站即可下载。下载教程 刷入系统后,应先执行 sudo apt-get update以及sudo apt-get upgrade,但由于国内原因,下载更新的安装包会非常慢,因此在执行这两句前应先修改树莓派镜像源,改成清华大学的镜像源,下载速度就会恢复正常。教程可见下方链接: 清华官方镜像源 另外,推荐使用VNCViewer进行远程控制树莓派,详细教程见下方链接 VNC远程控制树莓派 完成后如下图: 至此树莓派基础配置完毕 作者:ZY_Python
2021-10-29 11:15:07 277KB al ld 家居
1
Kaldi 和语音识别
2021-10-15 12:41:54 1.3MB Kaldi 语音识别
1
介绍了用Kaldi搭建语音识别系统的基本流程和原理
2021-10-13 14:09:50 223KB 语音识别 Kaldi
1
介绍了用Kaldi搭建语音识别系统的基本流程和原理
2021-10-13 14:09:49 223KB 语音识别 Kaldi
1