高真实感的人物形象SyncTalk

时间：2024-11-25 13:30:48浏览次数：9

标签：人物形象视频 -- 生成真实感 SyncTalk data NeRF

SyncTalk是一种基于NeRF的高同步性说话人合成方法，专门针对提升说话人视频真实感和同步性而设计，克服了以往在同步性方面遇到的挑战，仅使用5分钟的说话视频即可生成高真实感的人物形象。目前该工作已入选CVPR 2024

神经辐射场（NeRF）是一种神经网络，可以从部分二维图像中重建复杂的三维场景。各种模拟、游戏、媒体和物联网（IoT）应用程序都需要三维图像，以使数字交互更加逼真和准确。NeRF 可学习特定场景的几何形状、物体和角度。然后，它可以从新的视角呈现逼真的三维视图，自动生成合成数据以填补空白。

baidu网盘下载
https://pan.baidu.com/share/init ... PHjrRg&pwd=6666

双击inference.bat即可运行演示。
首次运行"inference.bat"时，需要自动下载几个文件，如果联网下载过慢，可以执行如下操作：
将checkpoints目录下的文件移动到C:\Users\Administrator\.cache\torch\hub\checkpoints目录
例如：C:\Users\Administrator\.cache\torch\hub\checkpoints\alexnet-owt-7be5be79.pth
注意：Administrator是windows的用户名，这里改成自己的用户即可。

看效果

SyncTalk3d数字人

定制自己的模型
更新代码：
SyncTalk项目地址:https://github.com/ZiqiaoPeng/SyncTalk

数据预处理
1、准备视频
视频要求，帧速率：25FPS，帧宽高：512*512，每帧画面必须有说话的人，视频长度建议在4分02秒内，多于此时间会报错，需要调整代码。
如果你视频中声音质量比较差的话，效果大概率不会好。声音质量比较差指的是：1）存在难以忽略的噪声。2）在空旷的房间里录制的视频有回音。3）视频人声不清楚。建议录制视频时候使用外接麦克风，不用拍摄设备自带的麦克风。

视频需要高分辨率，低分辨率的视频训练出来效果较差。

视频放入目录 SyncTalk-Windows\face-SyncTalk\SyncTalk\data\<ID>\<ID>.mp4

预处理命令：

python data_utils/process.py data/<ID>/<ID>.mp4 --asr ave

预处理一共分10个步骤，可以单独运行每一步：
例如单独运行第三步：
python data_utils/process.py data/meimei/meimei.mp4 --task 3

每一步都会生成相应文件，如下：
1.生成aud.wav
2.生成ori_imgs
3.生成parsing
4.生成bc.jpg
5.生成face_mask、torso_imgs
6.生成ori_imgs/*.lms
7.生成track_params.pt
8.生成flow_result、flow_list.txt、keypts.jpg、keypoints.txt、bundle_adjustment.pt、rigid_flow.jpg、track_xys.npy
9.生成bs.npy
10.生成transforms_train.json、transforms_val.json

可以使用最新版的AD-NeRF做预处理，AD_NeRF官网地址：https://github.com/YudongGuo/AD-NeRF/tree/master

开始训练
python.exe data_utils/process.py data/Mymay/Mymay.mp4 --asr ave

头部训练：
python main.py data/vrhm/  --workspace trial_vrhm/ -O --iters 200000

唇部微调
python main.py data/vrhm/  --workspace trial_vrhm/ -O --iters 500000 --finetune_lips

身体部分训练
python main.py data/vrhm/  --workspace trial_vrhm_torso/ -O --torso --head_ckpt <trial_ID>/checkpoints/npg_xxx.pth> --iters 200000 --preload 2

参考：
SyncTalk模型的安装、训练和推理方法-CSDN博客
 什么是 NeRF？– 神经辐射场简介 – AWS

高真实感的人物形象SyncTalk
https://www.jinshuangshi.com/forum.php?mod=viewthread&tid=885
(出处: 金双石科技)

标签：人物形象,视频,--,生成,真实感,SyncTalk,data,NeRF
From： https://blog.csdn.net/selifecn/article/details/144023571

AI美女照引爆网络，已经真假难辨？flux模型，给AI绘画带来前所未有的真实感，你能看出来吗？（附模
最近，网上掀起了一股AI美女照的热潮，让人不禁感叹：这互联网，还有没有活人了？AI美女这些AI美女照，不仅数量惊人，质量更是让人瞠目结舌。你可能会问，这真的是AI生成的吗？别急，咱们慢慢道来。首先，这些照片背后的技术，是一个名为Flux的模型。这个模型，之前就因为生成各种超高拟真度的人......
我给四个AI图像生成器做了一个‘真实感测试’——结果让我大吃一惊
根据What’stheBigData的数据，每天有超过340亿（没错，是B）AI图像被创造出来。市场的商品化如此严重，以至于许多AI图像生成器现在都是免费的。如果这些数字听起来疯狂，那是因为它们确实如此。尤其是当你记得这个市场在不到两年前才正式启动时。同时，这场狂欢对于全球用户来说是一大......
媲美Flux pro! Ideogram 发布了 2.0 图像生成模型, 照片级真实感和高质量文本渲染！
Ideogram发布了2.0模型,图像生成质量大幅提高，产品易用性改善，文字生成能力也提升许多。Ideogram2.0在图像快速对齐、照片级真实感和文本渲染质量方面取得了显著进步。人工评估一致认为Ideogram2.0比FluxPro和DALL·E3有了显著改进。尽管我们在图像质量方面有所改进，但......
Midjourney保姆级教程！7大方向教你快速生成你想要的人物形象！
一、前言由于在工作中，经常会涉及到使用人物素材完成Banner设计的工作，于是最近开始探索关于Midjourney进行AI人物生成的相关测试，同时将这一段时间的经验分享出来。刚开始接触和使用Midjourney的时候，最大的问题在于生成的人物图片无法保证人物位置的大小和视角，想要......
打造真实感十足的速度表盘：WPF实现动态效果与刻度绘制
概述：这个WPF项目通过XAML绘制汽车动态速度表盘，实现了0-300的速度刻度，包括数字、指针，并通过定时器模拟速度变化，展示了动态效果。详细实现包括界面设计、刻度绘制、指针角度计算等，通过C#代码与XAML文件结合完成。新建WPF项目：在VisualStudio中创建一个新的WPF项目。......
华为OD请己经入职的人出来谈谈你的真实感受？
修改了一下回答的排版，之前只要更新就在最前面，现在按照会见顺序重新整理了一下。部门捞人上海深圳西安东莞办公地武汉南京现在也有通道：点击通道2字写在前面总结一下我的体验其实挺好的，但是想提一点，无论我还是那些负面评价，都只是片面的，管中窥豹，并不代表你选择od之后的实......
谈谈我使用shopee买家通系统的真实感受
我作为一位虾皮卖家，亲身体验了Shopee买家通系统，想分享一下我的真实感受。这款营销工具声称采用了最新的防指纹防关联技术，具备自动批量注册买家号、自动加购、测评、补单等功能，一时间引起了我的极大兴趣，我从以下几点来详细分享一下。1、内置了防指纹技术系统内置的防指纹技术给我留......
UnityShader入门精要第十四章-非真实感渲染原理总结
前言开发中常常遇到的一个问题就是画面风格。接下来要介绍的就是统一修改画面风格的手段：非真实感渲染。这里同样只总结原理。非真实感渲染非真实感渲染(Non-PhotorealisticRendering，NPR)的方法来渲染游戏画面。非真实感渲染的一个主要目标是，使用一些渲染方法使得画面达到和......
真实感渲染：训练营2
大家好~本课程为“真实感渲染”的线上课程，从0开始，介绍相关的图形学算法和数学基础，给出详细的数学推导、伪代码和实现代码，最终带领大家开发出基于物理的渲染器线上课程资料......
Unity Shader 真实感水体渲染
这两周用UnityShader做了点简单的水体渲染，有真实感的也有非真实感的，打算这几天总结整理一下贴出来。毛星云大牛有一篇详细的真实感水体渲染介绍：https://zhuanlan.zhihu.c......

高真实感的人物形象SyncTalk

相关文章

赞助商

阅读排行