首页 > 其他分享 >万字长文带你深度学习AI绘画工具 Stable Diffusion 保姆级实战,AI绘画入门必看实用性教程!(附配套资料)

万字长文带你深度学习AI绘画工具 Stable Diffusion 保姆级实战,AI绘画入门必看实用性教程!(附配套资料)

时间:2024-08-08 18:55:42浏览次数:6  
标签:提示 文生 必看 图生 AI AIGC 绘画 quality 图标

大家好,我是设计师阿威

今天给大家分享一下 AI绘画工具Stable Diffusion的实战教程,非常适合新手入门和巩固以往知识体系,同时我也准备了配套的学习资料,本教程没有难懂的理论,全是实操的截图,非常通俗易懂。本教程没有难懂的理论,全是实操的截图,非常通俗易懂。

认真看完这篇教程,能够帮你在最短的时间里,掌握Stable Diffusion的核心操作方法。真正有效地提高工作的效率。

如果你还没有安装和使用过Stable Diffusion,那么可以看看我的往期入门教程2024最新超强AI绘画Stable Diffusion整合包安装教程,零基础入门必备! 安装包或各种模型插件下载,请看文末扫描免费获取哦

教程主要是讲我们在工作中高频使用的4个功能模块:文生图、图生图、后期处理和标签器。如下图:


1.Stable Diffusion 高效工作流程

1.1创意阶段:

效率高:【草图 + ControlNet + 提示词】这个方法出图的确定性高,但要一定的美术基础。

效率高:【网图 + ControlNet + 提示词】根据需求找一些合适的网图,再用SD生图。

效率高:【复制C站的图片信息】这个方法比较省事,但是不太好找到和需求接近的图。

效率低:【提示词】这个方法比较费时间,要不断地调整提示词去跑图抽盲盒。

1.2深入阶段:

效率高:【PS修型 + 局部重绘】这个方法出图的确定性高,但要一定的美术基础。

效率低:【提示词 + 局部重绘】这个方法比较费时间,要不断地跑图抽盲盒。

1.3最后整理、交付阶段:

效率高:【后期处理】确定性最高,1:1放大原图。

效率低:【高分辨率修复(Hires.fix)】需要调参数,比较费时间。

效率低:【SD脚本放大功能(SD upscale)】需要调参数,比较费时间。


2、大模型、外挂VAE模型、LORA模型、CLIP终止层数

2.1 大模型

大模型决定渲出来的风格。

用素材+SD底模(如SD1.5/SD1.4/SD2.1),深度学习之后炼制出的大模型,可以直接用来生图。

大模型决定了最终出图的大方向 。

2.2 外挂VAE模型:

VAE模型类似于PS滤镜。

是对大模型的补充,稳定画面的色彩范围。

作用是:滤镜+微调。

系统自带的VAE是animevae,效果一般,建议可以使用kl-f8-anime2或者vae-ft-mse-840000-ema-pruned。

anime2适合画二次元。840000适合画写实人物。

2.3LORA模型:

它是加强某一种风格的模型。

大模型的低秩适应,可以理解为模型插件。

它是在基于某个大模型的基础上,深度学习之后炼制出的小模型。

需要搭配大模型使用,可以在中小范围内影响出图的风格,或是增加大模型所没有的东西。


如果分不清大模型、LORA模型、VAE模型,可以上这个网址查看:https://spell.novelai.dev/

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

2.4、CLIP终止层数:

它就是:对比(语言到图像)预训练。

CLIP终止层次越小,渲出的图越接近我们的提示词。数值越大越不像。


3、提示词

正向提示词:

在正向提示词框里,写出需要生成内容的提示词。

反向提示词:

在反向提示词框里,写出不需要生成内容的提示词。

3.1提示词相关性:

关于人物类的提示词,一般将提示词相关性控制在 7-15 之间。

关于建筑等大场景类的提示词,一般控制在3-7左右。


3.2 正向提示词建议书写结构:

画面主要元素,画面细节描述,景别描述,风格描述,画面质量描述。


3.3提示词的分隔与权重:

1. 提示词要用英文“ , ” 隔开。

2. SD的提示词是没有从左到右的权重的,也就是说提示词的排名不分先后。如要加减提示词的权重,可以通过括号和数字来实现。


3.4正向质量提示词(通用)

3.4.1 清爽风格的质量正向提示词

Highest quality, ultra high definition, masterpiece, 8k quality‍

这段质量提示词生出的造型准确率比较高。适合二次元的风格。

3.5反向提示词(可以在任何文生图中通用):

NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs)))


3.6提示词融合

3.6.1“ _ ”:

在关键词和关键词之间加上“ _ ”,就可以把2种不同的东西融合在一起。如:man_chicken。

3.6.2[cat

标签:提示,文生,必看,图生,AI,AIGC,绘画,quality,图标
From: https://blog.csdn.net/A13531922961/article/details/140954542

相关文章

  • 论文笔记:Investigation of Passengers’ Perceived Transfer Distance in Urban Rail
    (基于XGBoost和SHAP的城市轨道交通站点乘客感知换乘距离研究)话题点:城市轨道交通站点、换乘距离、XGBoost模型、SHAP模型:感知传输距离偏差theRatioofPerceivedTransferDistanceDeviation(R)、XGBoost和SHAP模型考虑的因素:乘客个人属性、换乘设施和换乘环境相关的32个指......
  • AI赋能周界安防:智能视频分析技术构建无懈可击的安全防线
    周界安全防范是保护机场、电站、油库、监狱、工业园区等关键设施免受非法入侵和破坏的重要措施。传统的周界安防手段主要依靠人员巡查和物理屏障,但这种方式不仅人力成本高,而且效率较低,难以满足日益复杂多变的安全需求。随着AI技术的引入,特别是视频智能分析技术的成熟,周界安全防范......
  • 打造“明厨亮灶”方案:AI+视频智能监管让食品安全与透明度并行
    在食品安全日益成为公众关注焦点的今天,提升餐饮行业的透明度,增强消费者信任,已成为行业发展的重要趋势。其中,“明厨亮灶”作为一种创新的餐饮管理模式,正逐步成为提升食品安全水平、促进餐饮业健康发展的有效手段。明厨亮灶主要服务于市场监管部门、餐饮部门等行业主管部门,“AI智能......
  • 软道物联网+AI:解锁等候场景无限可能
    物联网+AI,趋势所在在当今这个日新月异的时代,AI迅速发展,重塑着我们的生活。物联网让万物互联,而AI则赋予这些数据生命,让它们能够学习、理解并预测我们的需求。从高效运转的自动化工厂到贴心便捷的智能助手,从引领未来出行的自动驾驶汽车到精准定制的个性化医疗服务,物联网+AI的触......
  • 连锁食品门店降本增效利器:AI+订货管理系统
    在连锁食品扩张征途中,每一家门店都是品牌形象的窗口,也是利润增长的源泉。然而,随着门店数量的增加和业务范围的扩大,连锁食品门店往往面临着诸多耗时耗本的挑战,从订单管理的混乱到供应链的复杂,再到资金结算的难题,会遇到各式各样的问题,考验着企业的运营效率与竞争力:✦连锁食......
  • 英智AI工程造价解决方案:英智AI造价师
     在科技日新月异的今天,人工智能(AI)技术已悄然渗透至各行各业,面对传统而复杂的工程造价领域,AI造价师的诞生,不仅是技术进步的象征,更是对传统造价工程师工作模式的一次深刻变革。面对这一趋势,造价工程师们应当积极应对,让AI成为工作中的得力助手。 英智智能宝是什么英智「智能......
  • Diffusers中Pipeline的数据类型是怎么设置和转化的,pipeline.dtype和pipeline.from_pre
    参考资料:Diffusers中DiffusionPipeline基类的[源码]众所周知Pipeline是Diffusers中最重要的一个API接口,一直以来我都对这个接口数据结构的获取一知半解,今天看了下源码终于知道了这个API结构的数据类型是如何设置的。直接看代码:@propertydefdtype(self)->torch......
  • AI 时代,网关更能打了?
    作者:澄潭、望宸网关在网络通信中扮演着诸多角色,包括数据转发、协议转化、负载均衡、访问控制和身份验证、安全防护、内容审核,以及服务和API颗粒度的管控等,因此常见的网关种类有流量网关、安全网关、微服务网关、API网关等。在不同语义下,网关的命名也会有所不同,例如K8s体系下......
  • 移动设备上的AI辅助视频创作工具
    摘要:本文介绍了一款专为移动设备设计的AI辅助视频创作工具,该工具能够将文本内容转换为动态漫画视频,为内容创作者提供了一种创新的表达方式。关键词:人工智能,视频创作,动态漫画,内容生成正文:随着移动技术的发展,内容创作者对于能够在移动设备上进行高效创作的工具需求日益增长......
  • 智林 - AI 答题应用平台介绍
    智林-AI答题应用平台一、项目介绍智林AI答题是一款基于Vue3+SpringBoot+Redis+ChatGLM+RxJava+SSE的AI答题应用平台。用户可以基于AI快速制作并发布答题应用,支持检索、分享、在线答题并基于AI得到回答总结;管理员可以集中管理和审核应用。什么是答题应......