首页 > 其他分享 >AI表情神同步!LivePortrait安装配置,一键包,使用教程

AI表情神同步!LivePortrait安装配置,一键包,使用教程

时间:2024-08-01 22:39:14浏览次数:21  
标签:视频 AI 可以 一键 LivePortrait 安装 表情

快手在AI视频这领域还真有点东西,视频生成工具“可灵”让大家玩得不亦乐乎。 现在又开源了一款超好玩的表情同步(表情控制)项目。   一看这图片,就知道是小视频平台出的,充满了娱乐性。发布没几天就已经有8000+Star。 项目简介   LivePortrait 是一款由快手团队开发的高效肖像动画工具,通过隐式关键点框架,从静态图像生成动态视频。该工具可以让用户通过驱动视频生成逼真的面部表情和头部动作。这款工具不仅可以用于人脸动画,还能扩展到动物肖像,提供了广泛的应用场景。   该项目主页核心介绍其实就一句话“Bring portraits to life!” 可以理解为让“ 将肖像变得栩栩如生!”。   下面先简单说一下这个项目的特点,然后分享一下本地安装方法,最后是一件包和使用方法!   项目特点   表情神同步   这个项目的表情同步非常传神,这也是这个项目最大的特点。         嘴巴和眼神的同步,比较惊艳。   可以驱动图片和视频 可以用一段带有人物脸部表情的视频去驱动一张图片,同时也可以用视频驱动视频。   前者高效,只要你能拿到一张脸部照片,就可以让这张照片开口说话,做出各种表情。 后者高能,用视频驱动视频,会显得效果更加自然。   素材支持广泛 只要是带脸和五官的东西,基本都能玩。         “肖像”可以包括 真人照,动漫人物,名画中的人物,甚至是兵马俑和动物。   单独修改眼睛和嘴巴 除了视频生成之外,还可以“一键P图”。       添加图片注释,不超过 140 字(可选)   就是那种一键闭眼一键睁眼。一键闭嘴一键张嘴那种。当然也可以,闭上眼张开嘴。有一定的可玩性。 电脑配置要求低 AI视频和AI绘画是非常消耗配置的项目,比如很多基于SDXL的AI绘画类项目,模型动不动就是10G+,显存需求动不动就是16G+甚至24G。但是这个项目好很多,预训练模型才600M+。模型小就意味着显存需求也很低!   安装配置比较简单 这个项目配置起来非常简单。只需要根据项目主页的命令一行一行复制、粘贴、运行即可。Windows下安装依赖无需踩坑,直接装就可以了。除了Windows之外也支持基于M系列的macOS系统。   本地安装 云端的都是别人的,本地的才是自己的。下面来说一说如何本地安装,如果看过我之前的安装配置的文章,这个项目的安装会非常简单。   先保证本地电脑已经具备如下软硬件:

  • NVIDIA中高端显卡
  • Windows11系统
  • Python环境
  • Git工具
外加,懂一点CMD命令。就可以立马开干了。   克隆代码 使用git命令克隆源代码。 git clone https://github.com/KwaiVGI/LivePortrait cd LivePortrait 克隆源代码之后,使用cd命令,进入到项目文件夹。   创建虚拟环境 使用conda工具创建一个虚拟环境,做本地隔离。 conda create -n LivePortrait python=3.10 conda activate LivePortrait 创建一个名为LivePortrait的基于Python3.10的虚拟环境,并且激活这个虚拟环境。   安装依赖 Python环境创建之后之后,通过req依赖文件,一键安装依赖 # 针对 Linux and Windows 用户 pip install -r requirements.txt # 针对macOS M系列 pip install -r requirements_macOS.txt 注意,Windows和Linux用户用上面的命令,使用requirements.txt里的依赖列表来安装。Macos的用户使用专属的macOS.txt文件来安装。   安装之前要保证网络通畅,或者设置好了pip镜像。   下载模型 经过上面的步骤,安装配置就已经完成了。接下来是要获取模型。 通过命令获取: #安装lfs,已经装过可以忽略 git lfs install #下载模型 git clone https://huggingface.co/KwaiVGI/LivePortrait temp_pretrained_weights mv temp_pretrained_weights/* pretrained_weights/ rm -rf temp_pretrained_weights 这些命令会从huggingface上下载模型,并放置到pretrained_weights文件中,由于HF已经被嗝屁了,所以局域网用户可能不是太方便。   通过网盘获取: 项目主页给出了百度盘谷歌盘,我也会整理好放在我的网盘,见文末。   模型的文件的目录结构如下: pretrained_weights ├── insightface │ └── models │ └── buffalo_l │ ├── 2d106det.onnx │ └── det_10g.onnx └── liveportrait ├── base_models │ ├── appearance_feature_extractor.pth │ ├── motion_extractor.pth │ ├── spade_generator.pth │ └── warping_module.pth ├── landmark.onnx └── retargeting_models └── stitching_retargeting_module.pth 模型并不是很大,网络好的话,下载起来很轻松。   快速运行推理 模型下载完成,并放置到指定路径之后,就可以运行了。   无界面运行: # Linux and Windows python inference.py # For macOS with Apple Silicon, Intel not supported, this maybe 20x slower than RTX 4090 PYTORCH_ENABLE_MPS_FALLBACK=1 python inference.py 直接用Python运行推理文件,这样软件会自动找演示素材,自动合成视频。   这种方式适合开发者快速验证环境,但是使用起来不是很方便。所以推荐第二种运行式。   使用网页版: # For Linux and Windows users (and macOS with Intel??) python app.py # For macOS with Apple Silicon users, Intel not supported, this maybe 20x slower than RTX 4090 PYTORCH_ENABLE_MPS_FALLBACK=1 python app.py 运行上述命令之后,就会使用基于Gradio的WEBUI了。   安装配置运行完成之后,下次要再次使用,输入如下命令即可。       切换到项目文件夹所在盘,比如E盘, 然后使用CD命令进入文件夹, 然后激活虚拟环境, 然后运行app.py。   网页版使用说明   运行成之后,复制URL地址到浏览器打开,就可以看到界面了。       ①左边上传源(Source)素材 ②右边上传驱动(Driving Video)视频 ③点击动画按钮(Animate)开始合成   这里的源素材,可以是图片,也可以是视频。而驱动视频自然自能是视频。界面上有一些参数,默认即可。   视频处理完成之后,就会显示在下面了。       左边是被驱动的图片,右边的是效果对比图。界面上只有三个头像的对比视频。   如果需要合成的最终视频,就是包含整个人物的完整视频,可以在文件夹中找到。 文件夹路径为:LivePortrait\animations   RTX3060上面,整个过程消耗了5.8G显存,125秒时间。   除了视频功能,还有一个改变图片表情的功能。 网页往下滚动,找到Retargeting功能。   通过调整target eyes-open ratio和target lip-open ratio这两参数,可以得到不同程度的表情。 0为闭合,0.8为张开,可以取一个极端值,或者中间值。     ①左边的Retargeting Input里面选择或者上传一张图片。 ②然后修改一下参数,比如把眼睛和嘴巴的参数设置为0.8。 ③最后点击Retargeting运行 最后就可以获得一张传世名作《蒙娜丽莎的惊讶》了。     另外通过相对俯仰(Relative Pitch)、相对偏航(Relative Yaw)和相对翻滚(Relative Roll)等参数可以改变 人脸的朝向。       这么一来,蒙娜丽莎就惊掉下巴了。   一键运行包   安装配置使用都说完了,最后简单说一下一键运行包。 一键运行包就是把上面的所有命令,模型,环境全部放在一起,省去了配置下载的过程。 只需要下载,解压,双击运行即可。   通过网盘可以下载到一个叫tonyhub-liveportrait-v1.0.0.7z的压缩包文件。 解压这个文件,在解压后的文件夹中找到run.exe。       双击exe文件启动软件。       看到Runing on local URL 表示启动成功,同时浏览器会自动打开,并显示表情同步生成的界面。然后根据上面操作来,就可以轻松制作一个表情同步的视频了。   这个项目是比较适合做搞笑短视频的,也可以用自己的表情嘴型去控制别人的表情和嘴型,配合上AI变声器,也是有非常大的可玩性。   给公众发送“LivePortrait”获取软件包! 博客:https://www.tonyisstark.com/2815.html ​        

标签:视频,AI,可以,一键,LivePortrait,安装,表情
From: https://www.cnblogs.com/wangpg/p/18337729

相关文章

  • 有什么好用的AI论文写作软件?
    现在市面上有许多优秀的AI论文写作软件,这些软件可以帮助提高论文写作的效率和质量。以下是一些推荐的AI论文写作软件:writehelp论文写作:可以免费生成论文大纲快速完成论文初稿优点:输入题目一键生成完整论文并提供(知网、维普等定稿检测系统)论文查重报告,内容逻辑连贯性、语句......
  • CF553E Kyoya and Train 题解
    Description给定一张\(n\)个点\(m\)条边的无重边无自环的有向图,你要从\(1\)号点到\(n\)号点去。如果你在\(t\)时刻之后到达\(n\)号点,你要交\(x\)元的罚款。每条边从\(a_i\)到\(b_i\),走过它需要花费\(c_i\)元,多次走过同一条边需要多次花费。走过每条边所需......
  • AI start
    训练模型来检测图像噪声区域通常需要以下步骤:数据准备:收集包含噪声和无噪声的图像样本作为训练数据。可以使用现有的带有噪声和无噪声标签的图像数据集,或者手动创建标签来标记图像中的噪声区域。数据预处理:对图像进行预处理,以便将其转换为适合模型训练的格式。这可能包括调整图......
  • LangChain的LCEL和Runnable你搞懂了吗
    LangChain的LCEL估计行业内的朋友都听过,但是LCEL里的RunnablePassthrough、RunnableParallel、RunnableBranch、RunnableLambda又是什么意思?什么场景下用?1、LCEL的定义和原理LangChain的核心是Chain,即对多个组件的一系列调用。LCEL是LangChain定义的表达式语言,是一种更加高效......
  • LayaAir3.x 设置2d刚体线性速度,在不同设备(分辨率)下,表现不一致的问题
    private_body:Laya.RigidBody;private_speed:number=20;letradian=this.owner.rotation*Math.PI/180;//注意:需要除以Laya.Browser.pixelRatioletv=newLaya.Vector2(Math.cos(radian)*this._speed/Laya.Browser.pixelRatio,......
  • 当费曼技巧邂逅 AI,强势征服所有学习领域
    作者:老余捞鱼原创不易,转载请标明出处及原作者。写在前面的话:    本文通过诺奖获得者费曼的方法加上应用人工智能,用四个简单的步骤可以研究学习任何领域的知识。    你上次遇到一门很难学的科目是什么时候?或者你花了很多时间来看哔哩哔哩视频学习如何更好......
  • 合宙air780E解决适配ws2812b灯带发送错误问题
    最近使用合宙air780E通过gpio口直驱ws2812b灯带,使用luatos开发,系统自带外设库sensor.ws2812b(pin,data,T0H,T0L,T1H,T1L) 详细接口文档见官方文档:luatos接口外设库文档上测试代码:--led灯条展示localthis={}localgpioId=24--输出gpio引脚localtimeDelay=2000-......
  • AI+云边端协同,EasyCVR视频汇聚技术赋能安防监控新生态
    随着信息技术的飞速发展和数字化时代的到来,安防监控领域的技术也在不断创新和突破。EasyCVR平台的视频汇聚技术作为其中的佼佼者,以其强大的视频处理、汇聚与融合能力,在安防监控领域展现出了巨大的应用潜力和价值。本文将详细介绍EasyCVR视频汇聚技术的特点及其在安防监控领域的应......
  • 星塔链startowerchain如何利用跳数网络减少Gas消耗
    在startowerchain的跳数网络协议中,可能会利用类似ChainlinkKeepers的机制来实现智能合约的自动化执行。具体来说,智能合约通常需要被一笔链上交易触发才能运行并发起状态变更。而Keepers是外部账户(EOA),可以在一定经济激励下触发智能合约基于预定义的条件执行。开发团队、D......
  • 星塔链startowerchain的跳数网络协议
    星塔链StarTowerChain的跳数网络协议是其技术架构中的一个重要组成部分,它对于提升区块链网络的性能、降低能耗和增强安全性具有重要意义。以下是对星塔链跳数网络协议的详细分析:一、跳数网络协议的基本概念跳数网络协议是星塔链中用于实现节点间数据交换和交易处理的一种机制......