首页 > 其他分享 >SIGGRAPH Asia 2024 | 网易伏羲研究成果入选,3D面部动画技术再获新突破

SIGGRAPH Asia 2024 | 网易伏羲研究成果入选,3D面部动画技术再获新突破

时间:2024-10-10 14:48:43浏览次数:8  
标签:动画 面部 Asia 2024 SIGGRAPH 伏羲 表情

近日,国际计算机图形与交互技术顶会SIGGRAPH Asia 2024公布论文接收结果:网易伏羲最新研究成果《FreeAvatar: Robust 3D Facial Animation Transfer by Learning an Expression Foundation Model》成功入选。今年12月,SIGGRAPH Asia 2024大会将在日本东京举行,届时网易伏羲实验室视觉计算团队成员将在大会现场亲述报告,与来自世界各地的计算机图形学专家和爱好者进行深入交流。

ACM SIGGRAPH年会由美国计算机学会(ACM)主办的计算机图形学顶级年度会议,每年在全球范围内举行两次,包括夏季在北美举办的SIGGRAPH以及冬季在亚洲举办的SIGGRAPH Asia。该会议是迄今为止世界上影响最广、规模最大,也是最权威的集科学、技术、艺术、商业于一身的图形学技术展示和学术会议。

此次网易伏羲的相关研究成果成功入选并受邀分享,彰显了其在表情理解与生成领域长期的创新努力,同时也为这些技术的应用与进步开辟了新的方向。该项研究成果首先在游戏中进行了落地实验,目前已成功应用于《逆水寒》手游中,合作推出的独具特色的“剧组模式”玩法自3月上线以来受到用户广泛好评,玩家能在游戏中一键完成AI选角、取景和拍摄,打字就能生成影视大片。

此外,在表情捕捉技术方面,该技术相较于传统的面部捕捉技术展现出了明显的优势。传统方法通常需要先进行面部捕捉,然后由美术人员进行精修;而采用我们的方法,算法可以直接输出高质量的结果,只需少量精修即可达到甚至超越传统方法的效果,不仅大幅减少了面部捕捉后处理的人力需求,显著提升了工作效率,同时也确保了最终输出的高质量。

在推动实践应用的同时,网易伏羲也在不断推进技术的迭代更新。论文中的核心技术——表情理解能力,已在ICCV 2021、CVPR 2022、CVPR 2023、CVPR 2024以及ECCV 2024国际表情识别挑战赛中连续五年夺冠,在CVPR 2024和ECCV 2024中更是包揽了全部赛道的冠军。未来,网易伏羲将进一步深入探索人脸表情的细粒度理解和生成,为行业带来更多创新成果。

以下为本次入选论文概要:

《FreeAvatar: Robust 3D Facial Animation Transfer by Learning an Expression Foundation Model》

基于表情基础大模型实现鲁棒的3D面部动画迁移

关键词:表情表征,面部动画迁移,半监督学习

涉及领域:表情理解,面部动画捕捉,人脸重建

论文链接:

http://arxiv.org/abs/2409.13180

开源链接:

https://github.com/FuxiVirtualHuman/free_avatar

3D面部动画迁移旨在捕捉人类面部的表情和动作,为数字化身创建逼真的面部动画。相关技术在多个领域展现出广阔的应用前景,尤其是在数字人、CG游戏、虚拟现实(VR)和增强现实(AR)等领域。它不仅可以增强角色动画的真实性和细节,使游戏世界更加生动,还能提供更加沉浸式的体验,帮助用户在虚拟环境中实现更自然的互动和交流。在工业界,面部动作捕捉系统,如Faceware和ARKit已经被广泛应用于实际生产,相比手动创建的动画,这些系统能够呈现更为精细的面部表情。随着计算机视觉技术的发展,视频驱动的面部动画迁移方法因其便捷性和低成本而受到越来越多的关注。然而,在实现自然和准确的表情迁移的同时,保证面部表情的一致性仍是一个待解决的挑战。

现有的方法通常同时采用面部几何先验和表情特征,以保持输入人脸和目标脸之间表情的语义一致性。然而,这些方法往往难以驱动目标角色生成高保真表情。首先,基于面部标记点的几何约束难以有效捕捉表达的细微变化,例如轻微皱眉和嘴唇压缩。此外,现有方法所采用的表情特征通常基于有限类别的离散情感分类任务进行训练,无法捕捉到细微的情感差异。

在此背景下,网易伏羲开创性地提出了一种仅依赖表情表征的高精度面部动画迁移方法——FreeAvatar,不仅能够在不牺牲精度的情况下大幅提升动画生成的速度,还能够更好地捕捉到细微的情感差异,使得生成的面部动画更加自然流畅。

该方法首先通过学习一个表情基础大模型(Expression Foundation Model),构建了一个细粒度且表征能力强大的隐空间。在这个空间中,具有相似表情的面部图像会聚集在一起,而不同表情的图像则相互远离。接着,我们提出了一种高效的表情驱动多角色动画器(Expression-driven Multi-avatar Animator),能够从提取的表情表征中自适应地生成多个目标角色的面部动画。这一技术突破将大幅降低动画制作的成本与门槛,同时有效提升角色表情的细腻程度和真实感,为多个行业领域提供了创新的解决方案。

该方法的具体亮点和突破如下:

算法创新:我们开发的表情基础大模型旨在构建一个通用的、细粒度且连续的潜在空间,该空间能够适应多种风格的面部图像,包括风格化的人物角色。借助这一模型,FreeAvatar 在进行面部动画迁移时能够保持高度的表情一致性。

鲁棒性强:该方案不仅适用于各种背景、光照条件以及不同视角下的面部图像,而且我们还专门针对非真人面部进行了数据和算法优化,确保了其在处理动漫角色或卡通人物时同样具备优秀的泛化能力。

降低成本与使用门槛:只需输入一张RGB图像,就能生成相应虚拟角色的面部动画,极大地扩展了应用范围的同时,显著降低了使用成本和技术门槛。

为了展示这一方法的有效性,以下是一系列演示案例,包括与现有面部捕捉设备的比较,与单目人脸重建方法的比较以及结合人脸重建技术完成特定角色的面部动画迁移。这些测试结果不仅凸显了该面部动画迁移算法在处理多样化的面部表情时所具备的高保真度,同时也证明了其在各种复杂环境条件下,甚至是应用于风格化的动漫角色时,依然保持着出色的泛化能力。这一系列的测试验证了该算法作为面部动画制作领域的一种低成本、低门槛、高效解决方案的潜力。

与Faceware面部捕捉设备的效果对比

与MataHuman Animator面部捕捉设备的效果对比

与最新单目人脸重建方案的效果对比

结合人脸重建技术生成特定演员的3D面部动画

(输入素材来源于网络,如有侵权请联系我们)

此次入选SIGGRAPH Asia 2024,标志着网易伏羲在表情理解与生成领域的前沿探索得到了国际认可。未来,随着技术的不断进步,网易伏羲将继续深化对面部表情细粒度理解和生成的研究,推动相关技术迈向更高层次,为行业带来更多的创新成果,助力创造更加丰富和真实的虚拟体验。我们期待,在不久的将来,无论是虚拟的游戏世界还是现实的应用场景,都能在网易伏羲表情理解与生成技术的推动下展现出更加细腻的情感表达,共同开启一个全民共创、充满创意与想象力的新时代。

扫码入群

探讨更多前沿技术进展

标签:动画,面部,Asia,2024,SIGGRAPH,伏羲,表情
From: https://www.cnblogs.com/wyfx/p/18456366

相关文章

  • 20222419 2024-2025-1 《网络与系统攻防技术》实验一实验报告
    1.实验内容1.1本周学习内容(1)了解了缓冲区溢出发展历史:红色代码、冲击波病毒、震荡波病毒、心脏出血、乌克兰断网、勒索病毒。(2)了解了缓冲区溢出漏洞的本质和危害:缓冲区溢出漏洞是由于程序没有进行严格的内存越界检查,导致数据溢出并覆盖相邻内存空间,从而可能被攻击者利用执行恶......
  • 2024.10.10 总结
    A:赛时发了什么疯非要来冲这题。不妨计各种颜色的宝石为0/1。考虑记前缀和的最大值为\(S_\max\),最小值为\(S_\min\),于是总的限制为\(|S_\max-S_\min|\leqk\)。考虑反向维护这个限制,即枚举一个\(i\),然后钦定\(i\leqS_\min\leqS_\max\leqi+k\),计算对应的序列个数。然后......
  • 2024-9-28
    新闻周刊2024.9.28导入:建立"定点医药机构相干人员"实行驾照式经分传统监管机构将从医药机构进一步精确到人的进步,让少部分违规人员收到更加严厉的处罚防止医保滥用,让违规者付出应有代价,确保医保资金真正惠民,让所有人都共同收益.视点:秋收"惠农"时农条机械化农......
  • 开放式耳机什么牌子好一点?2024这些开放式蓝牙耳机牌子最好
    很多人问我开放式耳机值得买吗?,我的回答是很肯定的,开放式蓝牙耳机是一种便于佩戴的无线耳机,因其夹在耳朵上方的设计而得名。这种耳机通常具有轻便、稳定的特点,非常适合在运动、旅行或日常使用时佩戴。正确佩戴开放式蓝牙耳机可以确保舒适性和良好的音质,同时减少耳机脱落的风险。......
  • 2024项目管理工具全攻略:项目经理带你解锁高效项目管理之路
    一、项目管理工具的重要性在现代企业中,项目管理工具扮演着至关重要的角色。首先,它极大地提高了团队协作效率。以ZohoProjects为例,其几乎每个模块都配置了筛选器,方便项目团队及时锁定需要的项目信息,让项目经理及时获取项目相关最新动态,进行方略调整。同时,像飞项项目管理工......
  • 2024年诺贝尔物理学奖
    2024年,诺贝尔物理学奖没有颁给物理学家,而是授予了两位计算机科学家,表彰他们在神经网络领域的开创性工作,这项研究成为了我们今天所称的人工智能的基础。这标志着物理学与计算机科学之间的深度融合。获奖者约翰·霍普菲尔德和杰弗里·辛顿对神经网络的发展产生了巨大的影响。霍......
  • 20222317 2024-2025-1《网络与系统攻防技术》实验一实验报告
    一、实验内容本次实验的对象是一个名为pwn1的linux可执行文件。该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们本次实验将学习两种方法运行这......
  • 20222306 2024-2025-1 《网络与系统攻防技术》实验一实验报告
    1.实验内容1.1本周学习内容①Linux基础知识基本的shell命令(例如:ls、cd、cp、touch、cat、su等等)在Linux中熟练使用编译器gcc、调试器gdb,尤其是gdb调试指令(例如:设置断点break/clear、启用/禁用断点enable/disable、运行程序run、继续运行continue、单步代码跟入函数step、查看......
  • 2024.9.27 模拟赛 CSP5
    模拟赛无T1光题贪心,发现首先让最大的减\(4\),这样最优并且不会涉及向下取整,等到数据范围小了以后直接\(O(n^4)\)暴力枚举。code#include<bits/stdc++.h>usingnamespacestd;inta,b,c,d;intans=1e9;#definemx(x,y)(x>y?(x):(y))#definemi(x,y)(x<y?(x):(y......
  • Camtasia2024破解版下载Camtasia2024安装包永久免费版电脑软件下载
    CamtasiaStudio2024软件:打造你的视频内容宇宙......