首页 > 其他分享 >高真实感的人物形象SyncTalk

高真实感的人物形象SyncTalk

时间:2024-11-25 13:30:48浏览次数:9  
标签:人物形象 视频 -- 生成 真实感 SyncTalk data NeRF

       SyncTalk是一种基于NeRF的高同步性说话人合成方法,专门针对提升说话人视频真实感和同步性而设计,克服了以往在同步性方面遇到的挑战,仅使用5分钟的说话视频即可生成高真实感的人物形象。目前该工作已入选CVPR 2024

        神经辐射场(NeRF)是一种神经网络,可以从部分二维图像中重建复杂的三维场景。各种模拟、游戏、媒体和物联网(IoT)应用程序都需要三维图像,以使数字交互更加逼真和准确。NeRF 可学习特定场景的几何形状、物体和角度。然后,它可以从新的视角呈现逼真的三维视图,自动生成合成数据以填补空白。

 




baidu网盘下载
https://pan.baidu.com/share/init ... PHjrRg&pwd=6666

双击inference.bat即可运行演示。
首次运行"inference.bat"时,需要自动下载几个文件,如果联网下载过慢,可以执行如下操作:
将checkpoints目录下的文件移动到C:\Users\Administrator\.cache\torch\hub\checkpoints目录
例如:C:\Users\Administrator\.cache\torch\hub\checkpoints\alexnet-owt-7be5be79.pth
注意:Administrator是windows的用户名,这里改成自己的用户即可。
 



看效果

<iframe allowfullscreen="true" data-mediaembed="bilibili" frameborder="0" id="xStdxWof-1732506356383" src="https://player.bilibili.com/player.html?aid=113515868264808"></iframe>

SyncTalk3d数字人



定制自己的模型
更新代码:
SyncTalk项目地址:https://github.com/ZiqiaoPeng/SyncTalk

数据预处理
1、准备视频
视频要求,帧速率 :25FPS,帧宽高:512*512,每帧画面必须有说话的人,视频长度建议在4分02秒内,多于此时间会报错,需要调整代码。
如果你视频中声音质量比较差的话,效果大概率不会好。声音质量比较差指的是:1)存在难以忽略的噪声。2)在空旷的房间里录制的视频有回音。3)视频人声不清楚。建议录制视频时候使用外接麦克风,不用拍摄设备自带的麦克风。

视频需要高分辨率,低分辨率的视频训练出来效果较差。

视频放入目录 SyncTalk-Windows\face-SyncTalk\SyncTalk\data\<ID>\<ID>.mp4

预处理命令:

python data_utils/process.py data/<ID>/<ID>.mp4 --asr ave


预处理一共分10个步骤,可以单独运行每一步:
例如单独运行第三步:
python  data_utils/process.py data/meimei/meimei.mp4 --task 3

每一步都会生成相应文件,如下:
1.生成aud.wav
2.生成ori_imgs
3.生成parsing
4.生成bc.jpg
5.生成face_mask、torso_imgs
6.生成ori_imgs/*.lms
7.生成track_params.pt
8.生成flow_result、flow_list.txt、keypts.jpg、keypoints.txt、bundle_adjustment.pt、rigid_flow.jpg、track_xys.npy
9.生成bs.npy
10.生成transforms_train.json、transforms_val.json


可以使用最新版的AD-NeRF做预处理,AD_NeRF官网地址:https://github.com/YudongGuo/AD-NeRF/tree/master


开始训练
python.exe data_utils/process.py data/Mymay/Mymay.mp4 --asr ave


 



头部训练:
python main.py data/vrhm/  --workspace trial_vrhm/ -O --iters 200000

唇部微调
python main.py data/vrhm/  --workspace trial_vrhm/ -O --iters 500000 --finetune_lips

身体部分训练
python main.py data/vrhm/  --workspace trial_vrhm_torso/ -O --torso --head_ckpt <trial_ID>/checkpoints/npg_xxx.pth> --iters 200000 --preload 2

 


参考:
SyncTalk模型的安装、训练和推理方法-CSDN博客
什么是 NeRF?– 神经辐射场简介 – AWS

高真实感的人物形象SyncTalk
https://www.jinshuangshi.com/forum.php?mod=viewthread&tid=885
(出处: 金双石科技)
 

标签:人物形象,视频,--,生成,真实感,SyncTalk,data,NeRF
From: https://blog.csdn.net/selifecn/article/details/144023571

相关文章

  • AI美女照引爆网络,已经真假难辨?flux模型,给AI绘画带来前所未有的真实感,你能看出来吗?(附模
    最近,网上掀起了一股AI美女照的热潮,让人不禁感叹:这互联网,还有没有活人了?AI美女这些AI美女照,不仅数量惊人,质量更是让人瞠目结舌。你可能会问,这真的是AI生成的吗?别急,咱们慢慢道来。首先,这些照片背后的技术,是一个名为Flux的模型。这个模型,之前就因为生成各种超高拟真度的人......
  • 我给四个AI图像生成器做了一个‘真实感测试’——结果让我大吃一惊
    根据What’stheBigData的数据,每天有超过340亿(没错,是B)AI图像被创造出来。市场的商品化如此严重,以至于许多AI图像生成器现在都是免费的。如果这些数字听起来疯狂,那是因为它们确实如此。尤其是当你记得这个市场在不到两年前才正式启动时。同时,这场狂欢对于全球用户来说是一大......
  • 媲美Flux pro! Ideogram 发布了 2.0 图像生成模型, 照片级真实感和高质量文本渲染!
    Ideogram发布了2.0模型,图像生成质量大幅提高,产品易用性改善,文字生成能力也提升许多。Ideogram2.0在图像快速对齐、照片级真实感和文本渲染质量方面取得了显著进步。人工评估一致认为Ideogram2.0比FluxPro和DALL·E3有了显著改进。尽管我们在图像质量方面有所改进,但......
  • Midjourney保姆级教程!7大方向教你快速生成你想要的人物形象!
    一、前言由于在工作中,经常会涉及到使用人物素材完成Banner设计的工作,于是最近开始探索关于Midjourney进行AI人物生成的相关测试,同时将这一段时间的经验分享出来。刚开始接触和使用Midjourney的时候,最大的问题在于生成的人物图片无法保证人物位置的大小和视角,想要......
  • 打造真实感十足的速度表盘:WPF实现动态效果与刻度绘制
     概述:这个WPF项目通过XAML绘制汽车动态速度表盘,实现了0-300的速度刻度,包括数字、指针,并通过定时器模拟速度变化,展示了动态效果。详细实现包括界面设计、刻度绘制、指针角度计算等,通过C#代码与XAML文件结合完成。新建WPF项目:在VisualStudio中创建一个新的WPF项目。......
  • 华为OD请己经入职的人出来谈谈你的真实感受?
    修改了一下回答的排版,之前只要更新就在最前面,现在按照会见顺序重新整理了一下。部门捞人上海深圳西安东莞办公地武汉南京现在也有通道:点击通道2字写在前面总结一下我的体验其实挺好的,但是想提一点,无论我还是那些负面评价,都只是片面的,管中窥豹,并不代表你选择od之后的实......
  • 谈谈我使用shopee买家通系统的真实感受
    我作为一位虾皮卖家,亲身体验了Shopee买家通系统,想分享一下我的真实感受。这款营销工具声称采用了最新的防指纹防关联技术,具备自动批量注册买家号、自动加购、测评、补单等功能,一时间引起了我的极大兴趣,我从以下几点来详细分享一下。1、内置了防指纹技术系统内置的防指纹技术给我留......
  • UnityShader入门精要第十四章-非真实感渲染原理总结
    前言开发中常常遇到的一个问题就是画面风格。接下来要介绍的就是统一修改画面风格的手段:非真实感渲染。这里同样只总结原理。非真实感渲染非真实感渲染(Non-PhotorealisticRendering,NPR)的方法来渲染游戏画面。非真实感渲染的一个主要目标是,使用一些渲染方法使得画面达到和......
  • 真实感渲染:训练营2
    大家好~本课程为“真实感渲染”的线上课程,从0开始,介绍相关的图形学算法和数学基础,给出详细的数学推导、伪代码和实现代码,最终带领大家开发出基于物理的渲染器线上课程资料......
  • Unity Shader 真实感水体渲染
    这两周用UnityShader做了点简单的水体渲染,有真实感的也有非真实感的,打算这几天总结整理一下贴出来。毛星云大牛有一篇详细的真实感水体渲染介绍:https://zhuanlan.zhihu.c......