Kaldi用于ivector和xvector的摘要 文件清单 ivector/ conf/ :为mfcc和vad配置文件 wav/ :测试音频(您也可以使用自己的wav路径,请参阅步骤1 ) 仅支持flac(安装flac),wav和sph(安装sph2pipe) model_3000h/ :预训练模型 enroll.sh :主进程enroll.sh data/ :保存提取的特征(已生成文件) utt2spk, wav.scp通过make_data.py生成两个文件 spk2utt :从utt2spk生成 log/ :保存所有日志 tmp/ :保存所有tmp文件 xvector/ c
2021-11-28 10:50:23 550KB python shell kaldi xvector
1
基于Alize的ivector算法,《声纹识别之Alize入门教程(三):I-vector》对应资源。https://blog.csdn.net/u012594175/article/details/88726163
2021-10-23 11:51:38 28.66MB 声纹识别 说话人识别 ivecto alize
1
Voxceleb1数据集中的说话人验证任务 该存储库包含使用Kaldi在Voxceleb1 [1]数据集上训练i-vector说话者识别系统的简单脚本。 它是根据Kaldi / egs / sre10上的run.sh文件修改的。 要求 卡尔迪工具包 如何使用 将所有文件移至{kaldi_root} / egs / sre10文件夹 修改run.sh文件中的数据集目录和参数以适合您的计算机。 运行run.sh文件 结果 使用voxceleb1训练数据对2048个组件GMM-UBM和600维i-vector提取器进行了训练,以进行验证任务。 与Kaldi egs上的sre10基线相比,训练参数几乎相同。 GMM-2048 CDS有效值:15.39% GMM-2048 LDA + CDS eer:8.103% GMM-2048 PLDA eer:5.446% 笔记 Voxceleb1数据集是
1
这是有微软开发的说话人识别工具包,里面包含了GMM-UBM,I-vecotr等说话人识别模型。
2019-12-21 20:33:56 2.32MB 微软 说话人识别 GMM-UBM IVector
1