首页 > 其他分享 >StyleSync 开源部分总结

StyleSync 开源部分总结

时间:2023-12-08 19:24:38浏览次数:29  
标签:总结 img StyleSync pred cv2 face 开源 人脸 resize

https://github.com/guanjz20/StyleSync_PyTorch

这个是号称最强的模型. 说百分之99拟合真人. 我们赶紧来学习.

首先权重和训练是不开源的. 我也只能尽可能的根据发布的代码来看能学到什么.

先说结论: 整体跟wav2lip百分之90相似. 都是视频--->图片--->抽取人脸landmark->每个图片根据音频生成新的图片->ffmpeg把图片变成视频即可.

==========首先我们看inference.py

parser.add_argument('--img_size', type=int, default=256)======这里跟wav2lip 的96比变大了. 所以结果demo看得出来明显比wav2lip生成的分辨率高很多 face, affine_matrix = restorer.align_warp_face(img.copy(), lmks3=lmk3_, smooth=True) ==========这里进行了人脸变形. face = cv2.resize(face, (args.img_size, args.img_size), interpolation=cv2.INTER_CUBIC)  然后人脸resize 然后他还使用了mask face_masked = face.copy() * img_mask 对人脸以外部分进行了保护.  pred = model(img_batch, mel_batch) # 预测新脸 pred = cv2.resize(pred, (x2 - x1, y2 - y1), interpolation=cv2.INTER_CUBIC) # resize回去 out_img = restorer.restore_img(img, pred, affine_matrix) # 逆仿射把人脸变回去. #最后ffmpeg写入视频. 总结确实比wav2lip 加入很多细节处理. 预处理和后处理!!!!!可以借鉴!!!!!!!!!!   ================stylesync_model.py   下面我们分析这个文件   audioConv2d  audio也用了conv计算. 加入了一些噪音好像 mask_n_noise. 后续的有时间看论文再找找有用的吸收洗手.   ======================结束======================                                                      

标签:总结,img,StyleSync,pred,cv2,face,开源,人脸,resize
From: https://www.cnblogs.com/zhangbo2008/p/17888870.html

相关文章

  • 每日总结
    今天复习外观,享元和代理模式。均为结构型模式。其中外观模式主要作用是隐藏子系统内部的复杂性,并为客户端提供一个简单而一致的接口。其中包括外观角色,系统角色。享元模式主要是有效地支持大量细粒度的对象共享。它通过共享对象来减少内存消耗和提高性能。其中主要包括享元接......
  • 我的2023技术总结
    做的项目使用.NET6的那个服务断断续续写了一年时间使用WPF、Winform、CefSharp开发的可切换谷歌IE内核的浏览器,断断续续写了大半年时间大数据服务维护使用Leaflet开发电子地图的功能,今年做了正经的前后端分离的项目(以前是按自己的方式搞的一套),前端是Vue年末做了一个ThreeJ......
  • 物联网后端个人第十四周总结
    物联网方面进度    1.登陆超时是因为后端运行的端口和前端监听的接口不一样,所以后端也没有报错,将二者修改一致即可    2.登录之后会进行平台的初始化,但是初始化的时候会卡住,此时只需要将路径的IP+端口后边的内容去掉即可    3.阅读并完成了jetlinks文档中......
  • 最新:2024年值得关注的15款顶级开源项目管理系统!
    推荐15个优秀的开源项目管理工具,比如:ProjectLibre、OpenProject、ERPNext、Redmine、禅道、Tuleap、Restyaboard等。项目经理面临各种复杂任务,包括追踪任务的进度、评估交付风险和管理整体工作量。为了顺利达成目标,一款靠谱的项目管理(PM)工具是必不可少的。但是,挑选项目管理工......
  • 使用Java实现面向对象编程 第八章 File IO 总结笔记
    java里操作文件1.第一步一定是获得这个文件(获得的文件,你是无法解析获得里面的内容,约等于获得冰。你只能知道大小颜色等。外表能够获取信息.)。2.第二步获得这个文件将这个文件转换成流。然后从这个io流里读取数据io流里又分为字符流(专门处理文字)字节流(专门处理2进制等文件)3.......
  • oVirt 4.5.5 发布 - 强大的开源虚拟化
    oVirt4.5.5-强大的开源虚拟化KVM+libvirt、Gluster、PatternFly和Ansible请访问原文链接:https://sysin.org/blog/ovirt/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.org强大的开源虚拟化oVirt是适用于整个企业的免费开源虚拟化解决方案社区支持oVirt是......
  • 13.2k star,推荐一款开源免费的windows软件,强大!高级
    来!先看下效果,具体介绍见下文Czkawka是一款用Rust语言编写的多功能应用程序,可以帮助用户查找和删除计算机中的重复文件、空文件夹、相似图片等不必要的文件。本文将介绍Czkawka的工具简介、如何安装使用、功能特点、类似软件等,并进行总结。工具简介Czkawka(波兰语发音为tch•kav......
  • Java语言基础知识全总结
    一.Java的优点1.      跨平台性。一次编译,到处运行。Java编译器会将Java代码编译成能在JVM上直接运行的字节码文件,C++会将源代码编译成可执行的二进制代码文件,所以C++执行速度快2.      纯面向对象。Java所有的代码都必须在类中书写。C++兼具面向对象和面向过程的特......
  • 题目总结
    1.constinta;   表示a是只读的intconsta;//常整型数    constint*a; //a是一个指向常整型数的指针 表示这个指针变量可以修改,但是不能通过这个指针变量修改其所指向地址的值int*consta; // a是一个指向整型数的常指针 表示这个指针变量不可以......
  • 最终版面试总结
    题目分析顺序1-》3-》2:题目-》要求-》内容教案编写总体架构1.教学目标2.教学重难点3.教学方法1.总模板粉笔给出试讲模板过渡语句面试试讲模板开头介绍尊敬的各位老师,大家好,(鞠躬)。我是参加高中数学面试xxxx号考生,我试讲的题目是《XXX》,下面开......