会说话的头
描述
该项目是的PyTorch实施。 在本文中,对GAN进行了设计和培训,可以从仅几张头像(可能只有一张)和面部表情中复制出真实的会说话的头部模型。
该论文解释了该模型的体系结构,但是缺少许多细节,并且没有发布正式的实现或受过训练的模型。
当前,仅实施了元培训过程,并且运行良好。 微调过程即将到来!
感谢社区帮助使该模型正常工作!
更多实施细节
在继续阅读之前,请阅读原始论文。
数据集
Talking Heads模型是使用数据集进行训练的。 该数据集是公开可用的,但是要下载它,您需要填写Google Docs请求访问。 训练集包含约140k的摇头视频(并非所有人都是不同的人)。
下载
该下载文件包含9个文件,每个文件约30GB。 直接从他们的服务器下载速度太慢,因此我们强烈建议您下载他们在Google云端硬盘中拥有的版本,该版本的下载速度约为25MB / s。 您可以使用
2022-08-24 14:28:25
32KB
Python
1