首页 > 其他分享 >Stable Diffusion 的 CFG Scale 参数

Stable Diffusion 的 CFG Scale 参数

时间:2023-06-21 20:06:45浏览次数:120  
标签:Diffusion Scale 20 提示 CFG scale Model

在图像生成过程中,CFG Scale 参数是一个关键因素,它控制着文本提示对生成图像的影响程度。

简而言之CFG Scale :

  • 参数越大,生成的图像与文本提示的相关性越高,但可能会失真。
  • 数值越小,相关性则越低,越有可能偏离提示或输入图像,但质量越好。

在实际应用中,将其设置在 7 到 11 之间往往能获得最佳的低噪效果。

值得注意的是,较高的 CFG Scale 数值不仅能提高生成结果与提示的匹配度,还会增加结果图片的饱和度和对比度,使颜色更加平滑,但纹理较少。然而,当数值高于 20 时,生成效果可能会出现反向变化,导致效果变差。

受CFG Scale参数变化影响最大的是连接度高的提示词图, 这意味着图中的单词彼此密切相关。

例如,提示“A photorealistic painting of a cat sitting on a chair”(一只猫坐在椅子上的逼真绘画)的提示词图将具有高度的连接性,因为提示中的所有词都彼此密切相关。

CFG scale: 1

CFG Scale = 1:生成的图像是一幅非常有创意的画,一只猫坐在椅子上。 它根本不像提示,模糊,坐姿奇怪、椅子奇怪等。

Stable Diffusion 的 CFG Scale 参数_Stable Diffusion

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 1, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 5

CFG Scale = 5:生成的图像有创意,且像提示。 猫坐在椅子上,尾巴有点奇怪, 颜色跟下面几个比,有点淡。

Stable Diffusion 的 CFG Scale 参数_Stable Diffusion_02

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 5, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 7

Stable Diffusion 的 CFG Scale 参数_bc_03

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 10

CFG Scale = 10:生成的图像开始看起来像提示。 椅子靠背有点奇怪。

Stable Diffusion 的 CFG Scale 参数_bc_04

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 10, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 15

CFG Scale = 15:生成的图像开始看起来像提示,不太可能有任何创意元素。 这只猫坐在逼真的房间里一张逼真的椅子上。

猫的耳朵、眼睛有点不匹配,过于突出了。

Stable Diffusion 的 CFG Scale 参数_Stable Diffusion_05

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 15, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 20

CFG Scale = 20:生成的图片看起来和提示的很像,不太可能有什么创意元素。 猫坐在逼真的房间里一张逼真的椅子上,画面非常细腻。

由于噪声多,猫脸,背景会感觉颜色有点突出了。

Stable Diffusion 的 CFG Scale 参数_Stable Diffusion_06

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 20, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG scale: 30

CFG Scale = 30: 生成的图完全变了风格。

Stable Diffusion 的 CFG Scale 参数_Stable Diffusion_07

A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 30, Seed: 1659328295, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122

CFG 音阶的最佳点是什么?

CFG 比例值介于 0 到 20 之间。一般来说,CFG 比例值介于 7 到 11 之间时会产生最佳的低噪效果。

以下是使用 CFG 的一些建议:

  • 从较低的 CFG 比例值开始并增加它,直到您对结果满意为止。
  • 对更复杂的提示使用更高的 CFG 比例值。
  • 对于您想要更有创意的提示,请使用较低的 CFG 比例值。
  • 尝试不同的 CFG 比例值,看看哪种最适合您。

标签:Diffusion,Scale,20,提示,CFG,scale,Model
From: https://blog.51cto.com/u_15588078/6531099

相关文章

  • Stable Diffusion 的随机种子 seed
    seed参数允许您指定一个随机种子,将用于初始化图像生成过程。相同的种子值每次都会产生相同的图像集,这对于再现性和一致性很有用。如果将种子值保留为-1,则每次运行文本-图像特性时将生成一个随机种子。最重要的是,具有相同参数、prompt和seed将产生完全相同的图像。多亏了这一......
  • Stable Diffusion 反向提示词 Negative prompts
    反向提示词(Negativeprompts)用于描述图片中不希望出现的内容。常用于阻止生成特定的事物、样式或修复某些图像异常。下面是一些例子从“宁静的精灵森林”中移除“苔藓”宁静的精灵森林peacefulelvenforest,thickforest,largelivingtreesarevisibleinthebackground,b......
  • 云上使用 Stable Diffusion ,模型数据如何共享和存储
    随着人工智能技术的爆发,内容生成式人工智能(AIGC)成为了当下热门领域。除了ChatGPT之外,文本生成图像技术更令人惊艳。StableDiffusion,是一款开源的深度学习模型。与Midjourney提供的直接将文本转化为图像的服务不同的是它允许用户自行搭配并训练自己的图像风格,这一特性吸引了......
  • tailscale-异地组网
    一、概要VPN是什么?看到VPN第一反应应该是FQ,但VPN最初应该也是最普遍的用途应该是用来做内网打通,这也是其名字虚拟私有网络的用意,VPN让你可以在公开的网络线路上建立一个私有的子网,然后将所有接入的机器都分配一个私有的内网地址,让他们可以通过VPN的私有网络互联。......
  • Linux安装StableDiffusion
    安装conda:https://www.xtuos.com/5532.htmlhttps://cloud.tencent.com/developer/article/2063049配置conda切换国内镜像源:https://blog.51cto.com/u_15073468/5528338condaconfig--addchannelshttp://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/condaconfig--add......
  • Stable Diffusion的发展历史
    StableDiffusion是一个基于深度学习的文本到图像模型,于2022年发布。它主要用于根据文本描述生成详细的图像,尽管它也可以应用于其他任务,如修复、绘制和生成由文本提示引导的图像到图像的翻译。它是由StabilityAI创业公司与许多学术研究人员和非营利组织合作开发的。早期发展S......
  • [rk3568]buildroot增加python ifcfg
    ifcfg·PyPI以上是包路径 Config.inconfigBR2_PACKAGE_PYTHON_IFCFG bool"python-ifcfg" help ifcfgisaparsingtoolkitforPython,builtwithafocus onergonomics,performanceandmodularity. https://github.com/ifcfg/ifcfgpython-ifcfg.hash......
  • 脚踩Midjourney、Stable Diffusion,谷歌StyleDrop真要杀疯了!
    脚踩Midjourney、StableDiffusion,谷歌StyleDrop真要杀疯了导语StyleDrop组件MuseMuse架构Muse图像生成实现流程适配器微调AdapterTuningMuse中的AdapterTuning反馈迭代训练最近,谷歌发布了一款引人瞩目的AI绘画工具——StyleDrop。这个工具通过学习特定的艺术风格,能够根据文字......
  • [转载]探索 StableDiffusion:生成高质量图片学习及应用
    转自公众号大淘宝技术 本文主要介绍了StableDiffusion在图片生成上的内容,然后详细说明了StableDiffusion的主要术语和参数,并探讨了如何使用prompt和高级技巧(如图像修复、训练自定义模型和图像编辑)来生成高质量的图片。 介绍StableDiffusion ▐ ......
  • Decimal中Scale和Precision是什么
    Precision(fieldlength)精度(字段长度)Scale(decimalplaces)范围(小数位数)例如:-4.75,precision=3,scale=2,和符号位无关详解MySQL要求精度大于等于范围:mysql>createtabletest(adecimal(1,3));ERROR1427(42000):Forfloat(M,D),double(M,D)ordeci......