在图像生成过程中,CFG Scale 参数是一个关键因素,它控制着文本提示对生成图像的影响程度。
简而言之CFG Scale :
- 参数越大,生成的图像与文本提示的相关性越高,但可能会失真。
- 数值越小,相关性则越低,越有可能偏离提示或输入图像,但质量越好。
在实际应用中,将其设置在 7 到 11 之间往往能获得最佳的低噪效果。
值得注意的是,较高的 CFG Scale 数值不仅能提高生成结果与提示的匹配度,还会增加结果图片的饱和度和对比度,使颜色更加平滑,但纹理较少。然而,当数值高于 20 时,生成效果可能会出现反向变化,导致效果变差。
受CFG Scale参数变化影响最大的是连接度高的提示词图, 这意味着图中的单词彼此密切相关。
例如,提示“A photorealistic painting of a cat sitting on a chair”(一只猫坐在椅子上的逼真绘画)的提示词图将具有高度的连接性,因为提示中的所有词都彼此密切相关。
CFG scale: 1
CFG Scale = 1:生成的图像是一幅非常有创意的画,一只猫坐在椅子上。 它根本不像提示,模糊,坐姿奇怪、椅子奇怪等。
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 1, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG scale: 5
CFG Scale = 5:生成的图像有创意,且像提示。 猫坐在椅子上,尾巴有点奇怪, 颜色跟下面几个比,有点淡。
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 5, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG scale: 7
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG scale: 10
CFG Scale = 10:生成的图像开始看起来像提示。 椅子靠背有点奇怪。
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 10, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG scale: 15
CFG Scale = 15:生成的图像开始看起来像提示,不太可能有任何创意元素。 这只猫坐在逼真的房间里一张逼真的椅子上。
猫的耳朵、眼睛有点不匹配,过于突出了。
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 15, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG scale: 20
CFG Scale = 20:生成的图片看起来和提示的很像,不太可能有什么创意元素。 猫坐在逼真的房间里一张逼真的椅子上,画面非常细腻。
由于噪声多,猫脸,背景会感觉颜色有点突出了。
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 20, Seed: 4104372660, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG scale: 30
CFG Scale = 30: 生成的图完全变了风格。
A photorealistic painting of a cat sitting on a chair
Negative prompt: duplicate
Steps: 20, Sampler: Euler a, CFG scale: 30, Seed: 1659328295, Size: 512x512, Model hash: 4199bcdd14, Model: revAnimated_v122
CFG 音阶的最佳点是什么?
CFG 比例值介于 0 到 20 之间。一般来说,CFG 比例值介于 7 到 11 之间时会产生最佳的低噪效果。
以下是使用 CFG 的一些建议:
- 从较低的 CFG 比例值开始并增加它,直到您对结果满意为止。
- 对更复杂的提示使用更高的 CFG 比例值。
- 对于您想要更有创意的提示,请使用较低的 CFG 比例值。
- 尝试不同的 CFG 比例值,看看哪种最适合您。