西安交通大学开源了人工智能SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片+音频就能生成高质量的视频。内含多个踩坑的解决办法,值得玩一玩。
windows运行环境构建
Install Python 3.10.6 Install git manually Install ffmpeg
sadtalker安装
git clone https://github.com/Winfredy/SadTalker.git
标签:说话,音频,SadTalker,照片,SadTalk,git,Install,3D From: https://www.cnblogs.com/n5you/p/17676594.html