首页 > 其他分享 >ComfyUI 基础教程(四) —— 应用 LoRA 模型控制图像生成特征

ComfyUI 基础教程(四) —— 应用 LoRA 模型控制图像生成特征

时间:2024-09-08 20:49:41浏览次数:4  
标签:训练 ComfyUI 模型 素材 基础教程 Lora LoRA 加载

前言

上一篇文章讲述了 ControlNet 模型的使用,如果掌握了 ControlNet 的使用之后,本文所讲的 Lora 模型将会非常容易理解。

一、LoRA 模型的概念

之前的文章中,在介绍模型种类时,简单介绍过 Lora 模型,LoRA 模型全称是 Low-Rank- Adaptaion of Large Language Models。是一种用于微调大语言模型的低次序适应技术。它最初用于 NLP 领域,特别是用于微调 GPT-3 等模型。在 Stable Diffusion 模型应用中, Lora 允许用户在不修改 SD 大模型的情况下,利用少量数据训练出具有特定画风、IP 或者人物特征的模型,这种模型在社区和个人开发者非常受欢迎。

想深入了解 LoRA 的原理的朋友,请自行学习。

二、Lora 的效果展示

以上都是行话。下面用通俗的语言介绍。
LoRA 相当于大模型之外的另外一种模型,它的主要作用是给原有的画面做一些微调。LoRA的种类有很多,有人物的、动作的、建筑的,甚至改变一些画风的、表情的、物品的,只要你加了某个特定的LoRA,它就会在画面中呈现。最常用的一个就是人物的,举个例子,最近非常火的黑神话悟空的各种图片:

这就是使用悟空的 LoRA 生成的。

下面这个,用的是胡桃的LoRA

可以看到不管怎么切换基础模型,不管怎么切换画风,LoRA始终是胡桃的LoRA,它画出来的就是胡桃。

三、 Lora 的使用

3.1 Lora 模型加载器

前面学会了使用 ControlNet,在来看 Lora 的使用就非常简单了。
首先到模型网站上下载自己想要的 Lora 模型。放到 ComfyUI\models\loras 文件夹下。然后添加一个 Lora 加载器节点。

该节点有三个参数,选择 Lora 模型,
Lora 模型的强度 - 这个数值越大,生成图像月偏向 Lora 模型风格
以及 Clip 的强度 - 文本提示词的强度
这些参数根据需要调整就行。

最后再将主模型的模型输出点连接到 Lora 加载器的输入点,主模型的 Clip 输出作为 Lora 加载器的输入,最后,Lora 加载器的输出,分别连接到 Clip 文本编码器和采样器的模型输入。

需要强调的是:Lora 模型的版本要和主模型版本保持一致。

3.2 Lora 使用演示

可以看到,当前选择了一个中国风的水墨场景的 Lora ,生成的图像,也就成了中国风的水墨风格。

3.3 Lora 堆的使用

如果要使用多个 Lora 模型,可以添加多个 Lora 加载器,依次串联起来。和 ControlNet 一样, 多个 Lora 模型可以使用 Lora 堆节点进行加载。
Lora 堆节点有很多,有的统一控制 Clip 强度,有的分别增加了开关,可以对每个 Lora 分别控制,但是基本都大同小异。这里展示简易 Lora 堆节点。

这里有一个总开关,可以开启或者关闭应用 Lora 堆,模式高级的化可以针对每个 Lora 模型设置 Clip 权重,最后输出到 应用LoRA 堆 节点。

四、本地训练 LoRA 模型

前面提到,Lora 有一个特点,就是个人消费级显卡也可以很快完成训练,这样就给了我们很多施展的空间。
下面来讲解训练 LoRA 模型的步骤:

4.1 下载安装 LoRA 训练器

训练模型的过程,俗称“炼丹”,训练模型的软件和环境,称为模型训练器,俗称“丹炉”。训练模型首先需要有一个模型训练器,目前网上有很多版本的 SD LoRA 模型训练器,这里还是比较推荐 秋葉 大佬的LoRA 模型训练器。
下载地址:
https://pan.baidu.com/s/1TBaoLkdJVjk_gPpqbUzZFw
https://pan.quark.cn/s/b4ccd1f635b6

4.2 训练数据准备

训练数据准备,主要做好下面几点:

  1. 训练素材处理
    首先要准备好训练素材,比如你想训练某个特定的人脸 LoRA 模型,你需要准备 一些该特定人物的人脸的照片,素材的质量直接决定了训练出的模型的质量。对素材有一些的要求,比如图片数量不少于 15 张,一般可以准备 20-50 张;图片的质量要高,主体内容清晰可见,特征明显,图片尽量构图简单,避免其它杂乱的元素;尽可能以人物脸部特写为主,多角度,多表情等; 减少重复或者相似度太高的图片。
    素材准备完毕后,还需要对图片进一步处理,对低像素的素材图片,进行高清放大处理。图片统一分辨率,注意分辨率为 64 的倍数,显存低的可切为 512 x 512, 显存高的可切为 1024 x 1024。可以借助一些软件或者工具批量裁切。

  2. 素材打标
    这一步的关键是对素材进行打标。

  3. 打标优化
    打标完成之后,还要对生成的文件中的标签进行再优化,删除某些和要训练的风格不一致的图片。
    这一步相对比较复杂一点,训练不同风格的 LoRA,打标的要求不一致。大家也可以在网上学习其它优秀的教程。

4.3 训练环境参数配置

这一步是需要配置训练的具体参数,比如每张素材图片训练多少步,总共训练多少轮等等。

4.4 模型训练

训练参数设置保存完之后,就可以开始训练了。训练过程中会自动进行模型保存。

4.5 模型测试

之前的文章有提到过,模型训练什么时候叫训练好了,是没有具体标准的,我们需要对训练生成的模型进行测试,感觉效果达到预期了,就可以停止训练了。

实操方式放上秋葉大佬视频

秋葉大佬训练 LoRA 教程

五、结束语

LoRA 非常好用,使用也很简单,大家可以多到开源站点上看看别人训练的 LoRA,学习学习。本文相对比较简单,到此结束。

标签:训练,ComfyUI,模型,素材,基础教程,Lora,LoRA,加载
From: https://www.cnblogs.com/joy99/p/18403415

相关文章

  • ComfyUI 基础教程(三) —— 应用 Controlnet 精准控制图像生成
    一、前言你是否有见过下面类似这样的图片:看起来平平无奇,当你站远点看,或者把眼睛眯成一条缝了看,你会发现,这个图中藏有一些特别的元素。这就是利用了Ai绘画中的ControlNet,实现对图片的相对更精准控制。上一篇文章讲述了文生图的基本工作流和最基础的核心插件用法。通过提示......
  • AI绘画: ComfyUI重磅更新!操作界面详解!取消悬浮面板,自带工装包作流管理功能!(附整合包)
    前言大家好,我是月月在7月初的一次更新中,ComfyUI官方推出了Beta版UI,取消了原本的悬浮面板,还新增了工作流管理功能,整体使用体验比之前好了很多。今天就为大家详细介绍一些新版UI的特点和用法。一、启用方式如果想启用最新的UI界面,需要将ComfyUI更新到最新版本......
  • 【Stable Diffusion】ComfyUI-插件-IPAdapter多图融合
    哈喽大家好,上期介绍了如何利用IPAdapter实现两张图的融合,那么如何将多图进行融合呢,这期来分享下效果如下,左侧为参考图IPAdapter多图融合工作流可以扫描下方,免费获取IPAdapter多图融合1、工作流将基础工作流中【IPAdapter】节点换成【IPAdapterEmbeds】,这里的图像......
  • 【VBA基础教程篇】Excel-VBA Debug调试相关操作
    Excel-VBADebug调试相关操作在工作窗口,上方菜单栏中,有一个专门的额菜单:Debug菜单,里面有debug相关操作。除此之外你也需要一些辅助窗口来帮助你更好的进行调试,1.Immediatewindow(立即窗口):类似其他IDE的console控制台。显示快捷键:Ctrl+G,也可以点击菜单栏View->Immediatewin......
  • llama factory LoRA微调qwen大模型 | 新手炼丹记录(1)
            之前用本地机器微调qwen大模型,结果由于显存不够或者其他配置问题,总是无法正常训练,莫名其妙报错。只能去尝试一些参数很小的模型,qwen2:0.5b、gemma:2b之类的,实在不够看。    今天尝试使用了算力平台AutoDL算力云租赁计算资源来跑微调以及量化,尝试了qwe......
  • 【AI绘画】全网最全,保姆级Stable Diffusion系列入门使用教程下篇(图生图、LoRA、提示词
    大家好,我是木木,又到了我们每天的分享时间。今天来介绍SSD常用功能,内容包含:LoRA、图生图、提示词权重。一、LoRA1、什么是LoRALoRA通常称之为微调模型,用于满足指定的风格或者人物特征属性。这种技术通过在模型的交叉注意力层中添加小的调整来实现风格和内容的变化,而不是......
  • 简单聊一聊大模型微调技术-LoRA
    简单聊一聊大模型微调技术-LoRAB站:肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频(bilibili.com)博客:肆十二-CSDN博客问答:(10封私信/72条消息)肆十二-知乎(zhihu.com)LoRA(Low-RankAdaptation)模型是一种用于减少深度学习模型训练中参数数量和计算资源消耗......
  • 详细AS32 TTL-100/-C LoRa模块配置及stm32+as32 ttl-100代码测试(总结了坑点)
    1.相关工具准备AS32TTL-100/C  泽耀官网卖的usb或者普通usb转ttl 上位机及串口调试助手,下载链接(官方资料)https://pan.baidu.com/s/14l6000nr3SR8pzBdyclYfg提取码:2580    也可去官网下泽耀科技(ashining.com)2.摘要(遇到坑点) ①MD0与MD1必须接,不能留空。A......
  • Stable Diffusion【XL Lora】推荐!AI助力服装设计,让服装拆分设计就是这么高效!
    今天给大家介绍一个服装饰品分类背景的基于SDXL的Lora模型:分类背景XUER。该模型是由作者(B站绪儿已成精)炼制,非常适合饰品服装分类背景。绪儿大佬其实推出了很多非常棒的模型,比如之前非常受大家喜欢的敦煌飞天、超梦幻场景等模型。下面我们来实际体验一下,看使用这个模型出来的图片......
  • 字节开源 FLUX Dev 的 Haper SD Lora,只需要 8 步或者 16 步就可以用 FLUX 生成图片!
    2024年8月26日,字节开源了FLUXDev的HaperSDLora。只需要8步或者16步就可以用FLUX生成图片,大幅减少FLUX的生成时间。建议LoRA比例约为0.125,该比例可适应训练和指导,比例可保持在3.5。较低步骤的LoRA即将推出。大家可以点击下面文章链接,文章包含模型下载链......