网站首页
编程语言
数据库
系统相关
其他分享
编程问答
表现力
2024-12-21
EmotiveTalk:高度解藕的情感数字人生成!
扩散模型已经彻底改变了说话人头部生成的领域,但在长时间生成中的表现力、可控性和稳定性方面仍面临挑战。在这项研究中,作者提出了EmotiveTalk框架来解决这些问题。首先,为了更好地控制唇部运动和面部表情的生成,设计了一种基于视觉引导的音频信息解耦(V-AID)方法,以生成与唇部运