纸 论文“深度融合集群网络”的源代码 图W.涂,周S.,刘X.,郭X,蔡Z. 被AAAI2021接受。 安装 克隆此仓库。 git clone https://github.com/WxTu/DFCN.git Windows 10或Linux 18.04 的Python 3.7.5 脾气暴躁的1.18.0 斯克莱恩0.21.3 火炬视觉0.3.0 Matplotlib 3.2.1 准备 我们总共采用了六个数据集,包括三个图形数据集(ACM,DBLP和CITE)和三个非图形数据集(USPS,HHAR和REUT)。 要在这些数据集上训练模型,请从(访问代码:4622)或下载它们。 代码结构与用法 在这里,我们提供了PyTorch中的深度融合集群网络(DFCN)的实现,以及DBLP数据集上的执行示例(由于文件大小的限制)。 该存储库的组织方式如下: load_data.py
1
用于单通道语音分离的深度聚类 “用于分割和分离的深度聚类判别嵌入”的实现 要求 参见 用法 在.yaml文件中配置实验,例如: train.yaml 训练: python ./train_dcnet.py --config conf/train.yaml --num-epoches 20 > train.log 2>&1 & 推理: python ./separate.py --num-spks 2 $mdl_dir/train.yaml $mdl_dir/final.pkl egs.scp 实验 配置 时代 调频 FF 毫米 FF /毫米 AVG 25 11.42 6.85 7.88 7.36 9.54 问与答 .scp文件的格式? wav.scp文件的格式遵循kaldi工具箱中的定义。 每行包含一个key value对,其中key是索引音频文件的唯一字符串,而值
2021-11-27 21:56:29 16KB pytorch speech-separation Python
1