蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

来源: 投稿作者: 菠萝的海子 2024-07-12 11:22:00 2

蚂蚁集团发布了开源项目 EchoMimic。据介绍，EchoMimic 不仅能根据人像面部特征和音频来帮人物对口型，还可以结合面部标志点和音频内容生成较为稳定、自然的视频。

GitHub：https://github.com/BadToBest/EchoMimic

EchoMimic 具备较高的稳定性和自然度，通过融合音频和面部标志点（面部关键特征和结构，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真实面部运动和表情变化的视频。

其支持单独使用音频或面部标志点生成肖像视频，也支持将音频和人像照片相结合做出 “对口型” 一般的效果。

下图是 EchoMimic 的工作原理：

EchoMimic 支持多语言（包含中文普通话、英语）及多风格，也可应对唱歌等场景。

访问主页查看更多示例：https://badtobest.github.io/echomimic.html

本站新闻禁止未经授权转载，违者依法追究相关法律责任。授权请联系：oscbianji#oschina.cn

本文标题：蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

本文地址：https://www.oschina.net/news/301682

标签：视频,音频,面部,EchoMimic,对口型,开源
From： https://www.cnblogs.com/sexintercourse/p/18312064

腾讯开源可控视频生成框架 MimicMotion
腾讯开源可控视频生成框架MimicMotion来源:投稿作者: 菠萝的海子2024-07-1617:01:19 4腾讯宣布开源可控视频生成框架MimicMotion，该框架可以通过提供参考人像及由骨骼序列表示的动作，来产生平滑的高质量人体动作视频。公告称，大量的实验结果和用户调研表明Mim......
【开源分享】2024PHP在线客服系统源码(全新UI+终身使用+安装教程)
PHP在线客服系统核心功能用户留言协同工作：留言后，用户能够享受在线咨询、订单查询等服务；登录状态也用于权限控制，确保不同用户访问合适的资源。咨询处理作用：提供实时或异步的客服咨询功能，允许用户向客服发送问题并接收回复。重要性：是客服系统的核心功能，直接影响用户体验和满意......
分享 6 款用于管理Docker容器的免费开源工具
Docker是一个开源平台，可自动执行应用程序的部署、扩展和管理。它使用容器化技术将应用程序及其依赖项打包到软件开发的标准化单元中。这使得使用容器创建、部署和运行应用程序变得更加容易，容器允许开发人员将应用程序及其所需的所有部分（例如库和其他依赖项）打包在一起，并将其全......
开源 C++ 框架 Ocean：用于计算机视觉和增强现实
Facebook开源了其内部用于计算机视觉(CV)和增强现实(AR) 应用程序的框架Ocean，用于执行各种任务，包括计算机视觉、几何、媒体处理、网络和渲染。Ocean主要使用C++编写，且不依赖于特定平台：Ocean是一个独立于平台的框架，支持所有主要操作系统，包括iOS、Android、Quest......
【开源库】libodb库编译及使用
前言本文介绍windows平台下libodb库的编译及使用。文末提供libodb-2.4.0编译好的msvc2019_64版本，可直接跳转自取libodb库libodb是一个开源、跨平台、跨数据库的对象关系映射（ORM）系统，可以持久化C++对象到关系数据库，而不必处理表、列或者SQL，无需手动编写任何映射代码。ODB......
【LLM大模型】《开源大模型食用指南》全网发布，轻松助你速通llm大模型！
前言《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于AutoDL平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，让更多的普通学生、研究者更好地使用......
支持语音电话、短信、企业微信、钉钉、APP、第三方接口、音柱等多种告警通知方式的智
AI视频监控平台简介AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实......
支持多路多算法实时监控与AI计算的智慧能源开源了。
简介AI视频监控平台,是一款功能强大且简单易用的实时算法视频监控系统。愿景在最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，减少企业级应用约95%的开发成本，用户仅需在界面上简单操作，即可实现全视频的接入及布控。 v：159......
MiniRHex：一种开源的六足机器人 by DYNAMIXEL Robotis
原文链接：https://www.youtube.com/watch?v=ldLXVDNCCzc At#IROS 2023,weranintotheCarnegieMellonUniversity RobomechanicsLab.TheyhadsomereallycoolrobotstherethatwerePoweredby#DYNAMIXEL XLseriesmotors.Oneoftherobotstheyhadfeat......
【开源库学习】libodb库学习（二）
使用持久对象前面的章节为我们提供了ODB的高级概述，并展示了如何使用它在数据库中存储C++对象。在本章中，我们将更详细地研究ODB对象持久性模型以及核心数据库API。我们将从第1节和第3节中的基本概念和术语开始，并继续讨论第4节中的odb:：数据库类、第5节中的事务和第6节中的连......

蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

相关文章

赞助商

阅读排行