首页 > 其他分享 >Stable Diffusion 常用模型下载与说明(保姆级)

Stable Diffusion 常用模型下载与说明(保姆级)

时间:2024-12-19 11:01:11浏览次数:6  
标签:Diffusion Embeddings AI 模型 使用 绘画 保姆 webui Stable

  • List item

相比于Midjourney,Stable Diffusion最大的优势就是开源。相比于Midjourney靠开发人员开发的少数模型,SD则每时每刻都有人在世界各地训练自己的模型并免费公开共享给全世界的使用者。(当然你可以通过训练自己的专有模型而专门用于某一用途,这也将成为你作为AI绘画者的最重要的核心竞争力之一)

因此,学会使用各类模型对于学习使用Stable Diffusion非常重要。

常用模型下载网址推荐

目前,模型数量最多的两个网站是https://civitai.com/https://huggingface.co/。civitai又称c站,有非常多精彩纷呈的模型,有了这些模型,我们分分钟就可以变成绘画大师,用AI画出各种我们想要的效果。

C站长这样:

你会看到很多模型的预览图被屏蔽了,需要你认证为成人才能浏览。至于为什么要成人才能浏览,想必大家也是懂的都懂。

也正是如此,该网站在国内是被屏蔽的。登录需要科学上网。

Huggingface则相对朴实无华一些,对模型的审核也会更加严格一些。但是好处在于不需要科学上网,而且网速很快

Huggingface界面如上。

它是一个综合性的网站,如果我们需要下载模型的话,选择Models。

进入之后,选择Text-to-Image,出来的就都是SD可以用的模型了。

除了C站和huggingface,其他的模型网站还有:

https://cyberes.github.io/stable-diffusion-models/

(SD的基础模型,不用科学上网,但是这些模型都一般般,意义不大)

https://rentry.co/sdmodels

(模型很多,但是界面没有C站友好,需要科学上网)

炼丹阁 (www.liandange.com)

(国内的网站,很多都是搬运的C站的模型,合规性未知,通过百度网盘下载)

LiblibAI(www.liblibai.com)

LiblibAI,号称是国内最大的原创AI模型分享网站,但其实很多都是搬运的C站的模型,不过确实也有不少人气原创模型发布者入驻了该网站。

不同模型的说明

如果你去自己下载模型,就会发现有各种不同类型的模型。

具体模型类型有checkpoint、Textual lnversion、Hypernetwork、Aesthetic Gradient、LoRA、LyCORIS、Controlnet、Poses、wildcards等等,看得人眼花缭乱。这些都是什么意思呢?

Checkpoint/大模型/底模型/主模型

Checkpoint模型是SD能够绘图的基础模型,因此被称为大模型、底模型或者主模型,WebUI上就叫它Stable Diffusion模型。安装完SD软件后,必须搭配主模型才能使用。不同的主模型,其画风和擅长的领域会有侧重。

checkpoint模型包含生成图像所需的一切,不需要额外的文件。但是它们体积很大,通常为2G-7G。

常见文件模式:尾缀ckpt、safetensors(如果都有提供的话建议下载safetensors,下同)

存放路径: \sd-webui-aki-v4\models\Stable-diffusion

模型的切换界面:

目前比较流行和常见的checkpoint模型有Anything系列(v3、v4.5、v5.0)、AbyssOrangeMix3、ChilloutMix、Deliberate、国风系列等等。这些checkpoint模型是从Stable Diffusion基本模型训练而来的,相当于基于原生安卓系统进行的二次开发。目前,大多数模型都是从 v1.4 或 v1.5 训练的。它们使用其他数据进行训练,以生成特定风格或对象的图像。这个我们后面还会专门开一个专题进行讲解。

不同模型在同一参数下的表现有时候可以用天差地别来形容,下面是个例子:

LoRA

当下最火的微调模型,可以将某一类型的人物或者事物的风格固定下来。它们通常为10-200 MB。必须与checkpoint模型一起使用。

现在比较火的Korean Doll Likeness、Taiwan Doll Likenes、Cute Girl mix都是真人美女LoRA模型,效果很惊艳。还有一些特定风格的LoRA也非常受欢迎,最著名的有墨心等。这个我们后面也会再开一个专题讲解。

常见文件模式:尾缀ckpt、safetensors、pt

存放路径: \sd-webui-aki-v4\models\Lora

有多个方式可以使用

方法1是在生成界面调取选用。这个的好处是可以自己设置预览图,从而有直观的感受。

而且部分LORA只支持这种方式使用(不过AI绘画日新月异,说不定哪天规则又变了~)

方法2是以插件形式使用。好处是可以很方便的灵活调用多个LORA,并对他们按着不同比例进行混合。

在启动器界面选择模型管理,点击LoRA模型(插件),点击添加模型,选择你要添加的LoRA模型,重启启动器。然后在WebUI界面选择相应的插件和权重比例即可。

VAE美化模型/变分自编码器

VAE,全名Variational autoenconder,中文叫变分自编码器。作用是:滤镜+微调。

有的大模型是会自带VAE的,比如Chilloutmix。如果再加VAE则可能画面效果不会更好,甚至适得其反。

顺便说一句,系统自带的VAE是animevae,效果一般,建议可以使用kl-f8-anime2或者vae-ft-mse-840000-ema-pruned。anime2适合画二次元,840000适合画写实人物。

常见文件模式: 尾缀ckpt、pt

存放路径: \sd-webui-aki-v4\ models\ VAE

模型的切换:

Embedding/Textual lnversion/文本反转模型和Hypernetworks

Embeddings 和 Hypernetworks 都属于微调模型,但目前Hypernetworks已经不太用了。

Embeddings/Textual lnversion中文翻译过来叫文本反转,通过仅使用的几张图像,就可以向模型教授新的概念。用于个性化图像生成。Embeddings是定义新关键字以生成新人物或图片风格的小文件。它们很小,通常为10-100 KB。必须将它们与checkpoint模型一起使用。

Embeddings 由于训练简单,文件小,因此一度很受大家欢迎。而且Embeddings 使用方法很简单,在安装之后,只要在提示词中提到它就相当于调用了,很方便。但由于Embeddings使用的训练集较小,因此出来的图片常常只是神似,做不到”形似“,所以目前很多人还是喜欢使用LORA模型。而且Embeddings 是一级目录,每次打开webui时都要加载一遍,太多了会影响webui的“开机速度”(但是不影响运行速度)。

不过有一些Embeddings 还是值得安装,比如EasyNegative这个Embeddings,里面包含了大量的负面词,可以减少你每次打一堆负面词的痛苦。

Embedding

常见文件模式: 尾缀pt

存放路径: \sd-webui-aki-v4\ embeddings

模型的切换通过文件名称来触发

Hypernetworks

常见文件模式: 尾缀pt

存放路径: \sd-webui-aki-v4\ models\ Hypernetworks

模型的切换通过文件名称来触发

DreamBooth模型

DreamBooth,可用于训练预调模型用的。是使用指定主题的图像进行演算,训练后可以让模型产生更精细和个性化的输出图像。

常见模式:尾缀ckpt、safetensors

常见大小:2G-7G

最新版本的DreamBooth是可以把那个Lora算法然后融合进来的

可以训练角色、画风、物件等,使用方法和主模型相同

训练路径:

LyCORIS模型

此类模型也可以归为Lora模型,也是属于微调模型的一种。一般文件大小在340M左右。不同的是训练方式与常见的lora不同,但效果似乎会更好不少。

其中本人较喜欢的“Miniature world style 微缩世界风格”就属于这类模型。

但要使用此类微调模型,需要先安装一个locon插件,直接将压缩包解压后放到StableDiffusion目录的extensions目录里。

插件地址

https://github.com/KohakuBlueleaf/a1111-sd-webui-locon

下载后直接解压缩在extensions中。

使用时注意,除了要将lora调入,还要在正向tag开头添加触发词

例如:这个微缩世界风格的lyCORIS的调用,正向描述语如下

mini\(ttp\), (8k, RAW photo, best quality, masterpiece:1.2), island, cinematic lighting,UHD,miniature, landscape, Crystal ball,on rock, lora:miniatureWorldStyle\_v10:0.8

小技巧

如果你下载了一个模型,却不知道怎么安装,打开这个网站

https://spell.novelai.dev/

把你下载的模型拖进去,立马就会帮你解析,告诉你应该放在那里。

不过,由于AI绘画日新月异,有的模型,网站可能还来不及收集和解析,会无法解读。

最后,如果你也对AI绘画感兴趣的话,欢迎关注本专栏,关注AI时代社,也欢迎评论转发点赞分享。

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

标签:Diffusion,Embeddings,AI,模型,使用,绘画,保姆,webui,Stable
From: https://blog.csdn.net/2401_85116933/article/details/144579965

相关文章

  • Stable Diffusion【Pony模型】:C站广受欢迎的底层大模型
    StableDiffusion,一款基于深度学习的图像生成模型,以其强大的图像生成能力和个性化风格迁移能力,在艺术创作领域掀起了一场革命。而Pony模型,作为StableDiffusion的底层大模型,更是备受C站用户的喜爱。本文将带你深入了解Pony模型的使用方法,助你轻松掌握这项前沿技术。Stable......
  • Stable Diffusion【基础篇】:提示词引导系数(CFG Scale)
    CFG(Classifier-FreeGuidance)用于控制StableDiffusion在采样期间应遵循提示词的严格程度。几乎所有稳定扩散AI图像生成器都提供了此参数设置。今天我们重点来看看在StableDiffusion中CFG参数相关内容。一.CFG是什么我们先以一个实例来看看CFG在不同参数值时的效果......
  • SSD201/202D修改默认自启动脚本的方法,保姆级攻略来了
    本文介绍SigmaStarSSD201/SSD202D修改默认自启动脚本的方法,方便让应用程序开机自启动。使用触觉智能的PurplePiR1双网口开发板演示,内置双核A71.2Ghz处理器,支持WiFi,是嵌入式新人入门学习的高性价比开发板!方法一:在系统中直接修改文件此方法适合开发调试使用打开customer/demo......
  • 【AI安全漏洞】VLLM反序列化漏洞分析与保姆级复现(附批量利用)
    #CVE-2024-9052环境需要Linux(这里使用kali)、Anaconda首先安装Anaconda前言最好使用linux,如果使用windows可能会产生各种报错(各种各种各种!!!),最好使用Anaconda,方便独立管理虚拟机使用conda创建虚拟机、python要求3.10condacreate-nvllm_beampython=3.10-y启动该虚拟机......
  • docker安装与使用之保姆级教程
    前言:一、定义Docker容器是一种轻量级、可移植、自包含的软件打包技术。它是通过Docker引擎创建的运行实例,将软件及其依赖项打包到一个独立的单元中,使得应用程序可以在不同的计算环境中以相同的方式运行。简单来说,就好像是一个装满了应用程序和它运行所需一切(如代码、运行......
  • 关于XXE靶场保姆级攻略
    一.XEE靶场来到我们的XXE靶场先随便输入账号密码抓个包我们发现了他有很多xml的字样,说明我们可以用xml进行攻击,上图下方框中的是html字样,这就是我们的注入点输入<?xmlversion="1.0"?><!DOCTYPEANY[<!ENTITYxxeSYSTEM"file:///c:/flag/flag">]>system后面......
  • CTFHUB靶场关于SSRF保姆级攻略
    一.内网访问输入127.0.0.1/flag.php二.伪协议读取文件输入?url=file:///var/www/html/flag.php右键页面查看源代码三.端口扫描尝试一下index.php,没有显示,说明有这个文件上方题中提示我们端口在8000-9000中我们用burpsuite抓包,开启代理输入?url=127.0.......
  • 【stable diffusion模型】首个中文Stable Diffusion模型开源
    前言生成内容一直被视为AI领域中最具有挑战性的能力,最近大火的AI绘画背后,是StableDiffusion模型的开源,催生了众多AI绘画的应用,得益于StabilityAI的开源精神,这一创变推动了整个以英文为主的下游文生图生态的蓬勃发展。然而在国内,目前大部分团队主要是基于翻译......
  • 【stable diffusion部署】文生图模型原理,以及Stable Diffusion部署体验
    前言LLM推理优化系统工程概述截止到目前市面上比较主流的基于文字生成影像的模型都是基于了3大部分组成的。EncoderModel,GenerationModel,DecoderModel。并且这三个部分是分开训练,然后组合在一起从而构成了文生图大模型。图片来源于B站李宏毅教授讲问生图原理,侵删......
  • 【ECCV 2024】Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID
    【ECCV2024】FaceAdapterforPre-TrainedDiffusionModelswithFine-GrainedIDandAttributeControl一、前言文章核心观点AbstractIntroduction本文的具体方法实现过程?网络的输入输出,条件是什么?损失函数是怎么设计的?网络输入输出,条件损失函数详细介绍SpatialCo......