首页 > 其他分享 >最强AI换脸软件FaceFusion一键包教程: 下一代脸部交换器和增强器。

最强AI换脸软件FaceFusion一键包教程: 下一代脸部交换器和增强器。

时间:2024-08-19 16:27:26浏览次数:8  
标签:交换器 遮罩 AI 模型 选择 人脸 FaceFusion 换脸 替换

大家好,今天给大家介绍一款强大的换脸工具——FaceFusion。

官方宣称的是: 下一代脸部交换器和增强器。
新版本在原有基础上增加了更多的模型和高清算法,显著提升了图片和视频的换脸效果。
此外,还新增了三种遮罩功能,有效解决了脸部有物体遮挡时的融合效果差和跳闪问题。

现在基础换脸模型+帧着色器模型+帧增强器模型+人脸增强模型+人脸调试模型的所有模型总数加起来得有44个,全部模型文件高达10G多。

 

版本更新

2024年06月17日,FaceFusion更新至2.6.1版本。

获取指南

一键整合包获取
请关注公众好: InnoTechX   公众好发送ff获取

解压密码:www.zhisk.com

 

前置条件

支持win10、win11。cuda也就是GPU加速仅支持N卡,没有N卡则只能使用cpu。 要使用cuda电脑本机cuda版本必须大于等于11.8。 查看cuda版本 切换到桌面,同时按win和r键,打开cmd运行框,输入 nvidia-smi 并回车,如下,可以看到我的cuda版本为12.4。如果你的cuda版本低于11.8,请前往 https://www.zhisk.com/1154.html 按照教程安装cuda

 

 

安装步骤

解压整合包,双击 启动整合包.exe。

 

进入CMD界面,稍作等待,启动时间一般2~3s,配置不是太好可能会久一点。

 


待程序打开后,即可自动打开网页 http://127.0.0.1:7860/ 进入主界面。

 

 

常用设置介绍

帧处理器

在帧处理器界面,我们有六个选项:

 


其中关于每个模式的介绍
face_swapper(换脸模式)
默认勾选,开启后即可进行换脸操作。必须勾选不然无法换脸

 

face_enhancer(脸部增强)
提升转换后视频中人物面部的清晰度。


face_debugger(调试模式)
用于遮罩调试,正常换脸时无需勾选。

 

frame_colorizer(帧着色器)
为框架着色的模型,选择人脸和目标人脸色彩混合


frame_enhancer(画面增强)
提升整体视频清晰度,但会增加处理时间。


lip_syncer(口型同步)
负责同步嘴唇的帧处理器


换脸模型选择

可选择不同的换脸模型:

 


blendswap_256
专注于面孔混合与交换,分辨率为256x256像素。

inswapper_128和inswapper_128_fp16
默认的是inswapper_128_fp16,这个模型已经能处理绝大部分换脸场景了。
128指的是处理的图像分辨率为128x128像素。
fp16指的是该模型使用16位浮点数(FP16)进行计算,这通常意味着它在保持足够精度的同时,能够减少计算资源的需求,加快处理速度,特别适用于资源有限的环境或需要实时处理的应用。

simswap_256
这个模型采用了相似性交换算法,256指的是模型处理的分辨率为256x256像素。这种模型在保持原图像质量的同时,能够实现高质量的面部交换效果。

simswap_512 和 simswap_256 模型相似,区别在于512版本支持更高分辨率,即512x512像素,能生成更高清晰度的面部交换效果。unofficial 表示该版本并非官方发布,而是由社区成员基于原版模型的修改或扩展。

 

uniface_256

面饰模型 uniface_256,这是一种高精度、高分辨率的面部纹理模型。
通过引入此模型,用户可以为虚拟形象添加更加细腻、真实的面部细节,提高虚拟形象的逼真程度。

 

根据项目需求选择不同的模型。使用16位浮点数(如 inswapper_128_fp16)是一种优化技术,可以在不明显影响输出质量的前提下加速模型运行。更高分辨率的模型(如 simswap_512)可以提供更细致的图像细节,但需要更多的计算资源和处理时间。




执行器选择

 

 

根据显卡选择Cuda或CPU模式,电脑显卡是N卡(英伟达),选择cuda。如果是A卡则选择CPU。
(CPU执行视频会比较慢,图片则无所谓,最好是使用8G以上N系显卡来处理视频换脸)

执行线程数

 

根据显卡显存调节,8G以下显存保持默认,8G以上显存可调高至8-10。视频换脸基本使用都会飙升到5G左右。

执行队列数

 

用于批量换脸操作,保持默认即可。


视频内存策略、系统内存限制

 

保持默认,由程序控制。


输出路径

 

设置输出图片或者视频的存放位置,如果想要更换存储位置可以修改,记住不要带中文路径。



常见选项

 

keep-temp: 不建议勾选,避免占用硬盘空间。
skip-audio: 勾选后会剔除掉音频,输出后的视频无音频
skip-download: 建议勾选,我们所有的模型全部都下载完毕,可以跳过检查步骤。加快运行速度。


简单换脸

 

 

点击人脸,选择人脸照片(清晰正面照,路径均不要带中文)。

这里我们选择霉姐

 

点击目标,选择要替换的图片或视频。

 

这里我们随便选择一个小姐姐

 

在预览区可以调整设置,这些属性稍后介绍,点击 开始 按钮进行替换。
如需更清晰效果,勾选脸部增强,如下图这样,不勾选face_enhancer图片会模糊

 




多人换脸

这里选择马斯克作为人脸,霉姐和另一个男人图片作为目标

 

 

人脸选择器模式

 

many: 替换所有检测到的人脸,如下图片。

 

one: 只替换检测到的第一张人脸,默认从左到右,就是说如果要替换的图片中有两张人脸,默认只替换最左边的一张

 

reference: 默认会替换检测到的第一张人脸,但是可以在 参考人脸 中选择替换哪一张脸,下图在 参考人脸 选择第二张脸替换马斯克的脸

 

 

下图选择霉姐的脸替换马斯克的脸

 

 

 

 

 

 

参考人脸距离 参数

 

在大多数情况下,使用默认值0.6已经足够。然而,如果系统未能识别出人脸,比如在视频或者图片中出现较大角度的低头或侧脸镜头时,检测到的人脸匹配度可能较低,这时可以考虑将该值调高。

遮罩换脸

比如美女带口罩的图片

 

在脸部有物体遮挡时,选择适当的遮罩模式,达到更好的融合效果。使用遮罩时建议开启调试模式,也就是face_debugger这个模式,开启这个选项会有人脸调试器选项提供选择。这个选项仅供预览使用,点 开始 前,取消勾选face_debugger

 

预览画面里的红框就是程序 box 模式的遮罩

 

选择 occlusion 模式 可以只替换被口罩以上的范围

 

 

遮罩模糊

 

默认情况下,该值设为0.3,用于调节遮挡物体的透明度。
如果处理的不是透明物体,可以将其调整到0.5以上。
需要提醒的是,在使用封闭遮罩模式时,遮罩模糊值的设置可能需要多次尝试才能找到合适的数值。
不过,这个值并不是越大越好,对于透明物体,如眼镜或玻璃杯,适当调小这个值可能会带来更真实的融合效果。

region脸部区域模式

 

勾选后可以选择替换眉毛、鼻子、眼睛、嘴巴等部位,不想要替换的地方可以不替换。
不想替换掉原视频里脸上的某个部位就可以不勾选。默认全部勾选,全部替换



实时直播

想要进行直播换脸,就点击 实时直播.exe

 

插入摄像头设备,网络摄像头模式选择inline即可,显卡不好,画面会比较卡。

画面模糊勾选face_enhancer,如果没有N系显卡显存8G以上还是不要试了,8G执行face_enhancer都比较卡。12G显存应该没问题。

 

    以上操作,RTX3060显卡测试通过!!!  

上面就是FaceFusion的详细使用方法,感谢您的阅读!

标签:交换器,遮罩,AI,模型,选择,人脸,FaceFusion,换脸,替换
From: https://www.cnblogs.com/zhikes/p/18367544

相关文章

  • AI大模型快速生成题库-助力业务人效提升10+倍
    一现状·问题1、培训考核涉及的文件数量较多当前,京东航空公司维修部门面临着人员规模的快速增长和持续的培训需求。根据民航局的规定,维修培训必须确保所有维修人员都能够完成对飞机维修相关文件的学习,这包括维修方案、维修工程管理手册、工作程序手册等共计12本手册以及民航局......
  • Haitang and Triangle
    这题的意思是构造三角形,如果n-2==m是一定无法构造的,因为少边,其次只要先从大到小输出满足三角形的个数边,剩下的输出最大值最小值#include<bits/stdc++.h>#defineintlonglong#defineIOSios::sync_with_stdio(false);cin.tie(0);cout.tie(0);#defineendl'\n'usi......
  • 吴恩达力荐,100%好评-LangChain大型语言模型(LLM)应用开发
       LangChain是一个开源框架,旨在帮助人工智能开发者将大语言模型(如GPT-4)与外部计算和数据源结合起来。这个框架提供了Python和JavaScript包,使开发者能够轻松地将自己的数据与大语言模型连接起来,从而实现更复杂的人工智能应用。   免费获取:吴恩达力荐,100%好评-Lang......
  • 原创文章被检测为AI创作,AI检测还靠谱吗?
    自从GPT火了以后,网络上的AI内容就变得泛滥了,刚开始还能轻松辨别哪些是AI的(一眼AI),哪些是人写的。现在这一两年里,随着生成式AI不断深入人心,AI内容变得更加泛滥了,并且经过这段时间技术的发展,AI生成的内容越来越真假难辨......
  • 1秒构建企业智能门户,销售额倍增,人才触手可及——NIM加持的全新AI虚拟接待!
    随着企业数字化转型的推进,智能化和高效服务成为企业竞争力的关键。我们设计了一款基于NvidiaNIM模型加速平台的智能企业门户接待系统,利用先进的AI技术,只需粘贴您的门户主页(耗时1s)便能自动构建智能虚拟接待员,帮助企业实现更高效的客户支持、产品推荐和人才招聘。这一系统不仅提......
  • 【聚星文社】Ai小说推文一键生成工具反推流程
    反推流程是指根据已有的信息,推断出可能的生成方式或步骤。对于Ai小说推文一键生成工具的反推流程,以下是一个可能的流程:Ai小说推文一键生成工具反推流程https://docs.qq.com/doc/DRU1vcUZlanBKR2xy分析推文生成结果:首先,需要观察和分析使用Ai小说推文一键生成工具生成的推文结......
  • Java轻松实现跨平台(Windows、Linux)多协议(Twain、Sane)的Web扫描
     由于项目需要,开发在Windows下与Linux下扫描功能,Linux主要是信创的两个系统(UOS、麒麟),研究了一下发现,Windows使用Twain协议与扫描仪通讯,Linux使用的是Sane协议与扫描仪通讯,找到Twain协议和Sane协议的标准文档,英文的,都有大几百页,项目一个月内要求上线,明显没时间慢慢研究,于......
  • AI大模型神作推荐:深入浅出,从基础到前沿的全面学习!
    今天给大家推荐一本大模型神书,就是这本:《大语言模型:基础与前沿》,本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用,涵盖大语言模型的广泛主题,从基础到前沿,从方法到应用,不仅涵盖了经典的语言模型知识,还重点介绍了最新的研究成果和技术进展。适宜人群本书内容全......
  • 【AI+安全】网络安全大模型开源工具
    在GPT和大型语言模型在网络安全领域的广泛应用情况下。通过收集整理以下基于GPT的开源代码,它们从主要集中在自动化渗透测试到漏洞分析,代码审查方面,这些开源代码能够在我们工作中提供更多支持和帮助。一、Ret2GPT它是面向CTF二进制安全的工具,结合ChatGPTAPI、Retdec和Langchain......
  • 合宙Air780E开发板集成EC11旋转编码器实战指南
    合宙Air780E开发板,作为一款基于Cat.1技术的物联网通信模组开发板,依托移芯EC618平台,以其低功耗、全网通及丰富的接口支持特性,它支持AT指令和LuatOS二次开发,在物联网领域展现出了强大的竞争力。今天我们来讲解一个基于Air780E开发板,集成ec11旋转编码器的实例。 合宙支持LuatO......