首页 > 其他分享 >AI绘画小白福音!Stable Diffusion 保姆级教程

AI绘画小白福音!Stable Diffusion 保姆级教程

时间:2024-07-18 13:59:04浏览次数:17  
标签:Diffusion AI AIGC 生成 提示 Stable 输入 图片

大家好,今天,我们就来进行 AI 绘画的文生图实战。(文末附籽料)

unsetunset文生图实战unsetunset

模型安装后之后,就可以开始激动人心的 AI 文生图了,下面我们以文生图为例,一边操作一边讲解提示词的语法和分类,以及出图参数的作用和使用方法。

在开始之前,我们再来回顾一下,我们的需求是让 AI 生成我们所要求的图片。

图片风格由模型本身和提示词决定,不同模型擅长生成不同风格的图片;而图片内容由我们的提示词决定,正向提示词会让图片展示对应内容,也会影响画质,反向提示词会让图片不生成什么内容;同时,提示词也可以分为内容提示词以及画质和画风提示词可以帮助我们将我们需要的图片更加具体准确的描述出来;而出图参数决定生成图片的大小,数量,质量等。

OK,下面是一个实际案例,通过文字来生成二次元图片。

我选择了大模型 「cetusMix_Version3.5」,vae 选择的是 「kl-f8-anime2.ckpt」,这是一个比较通用的二次元 vae 模型。

接下来需要输入提示词让 AI 知道你想要画的内容是什么,所以,我们这里先介绍一下提示词的概念、分类和语法。

提示词概念

什么是提示词 (prompt) ?广义地解释,Prompt 是指用户输入的文本或图像信息,目的是指导模型根据一些特定的需求生成艺术作品,翻译过来就是你告诉 AI,你想要画的内容是什么,画成什么样的一种语言。之前我们提到过,AI 绘画的两种基本形式是文生图和图生图,文生图主要通过文字来传递信息,而图生图则是通过图片和文字一起来传递信息。

提示词包括的内容,是非常广泛的,它可能包括作品主题、画风、形象特点以及一些具体包含的要素,不同的提示词分别向AI描绘了画面风格、人物体貌、服饰特点、场景内容和一些额外的修饰性元素。下面我们介绍一下提示词的分类。

提示词分类

提示词按正向反向可以分为正向提示词和反向提示词,正向提示词的内容是你需要图片生成出来的,而反向提示词的内容是你不想让图片出现的,反向提示词一般用通用提示词就可以了,是为了避免AI 绘制出,低质量,丑的,多手指,少手指等情况出现。。

提示词按内容和画质可以分为两个大类,内容提示词和画质画风提示词,两个大类下面又各有几个小类;。

内容提示词

人物及主体特征

  • 服饰穿搭

  • 发型发色

  • 五官特点

  • 面部表情

  • 肢体动作

场景内容

  • 室内、室外

  • 大场景

  • 小细节

环境光照

  • 白天黑夜

  • 特定时段

  • 光环境

  • 天空

画幅视角

  • 距离 close-up,distant

  • 人物比例 full body,upperbody

  • 观察视角 from above, view of back

  • 镜头类型 wide angle,Sony A7

画质和画风提示词
  • 通用高画质 bestquality,ultra-detailed,masterpiece,hires,8k

  • 特定高分辨率类型 extremelydetailedCGunity8kwallpaper(超精细的8KUnity游戏CG),unrealenginerendered(虚幻引|擎渲染)

  • 插画风 illustration,painting,paintbrush

  • 二次元 anime,comic,gameCG

  • 写实系 photorealistic,realistic,photograph

通用模板

下面给出一个通用模板。

提示词语法

基本语法
  • 提示词需要用英语来书写;

  • 以词组为单位,不需要完整的句子。

  • 通过英文半角逗号 「,」 来分隔提示词。

提示词权重

给提示词加权重,一层原括号是1.1倍,两乘括号就是1.1乘以1.1等于1.21倍;比如 (red ball), ((blue ball)) 。同样的,大括号是1.05倍,方括号是0.9倍。

你也可以在直接在括号中对给提词词加一个冒号,输入数字的权重;比如 (yellow flower:1.5) 。

注意一个词条的权重不能太高,安全范围是0.5到1.5;太高的话,容易毁坏整个画面。

进阶语法

在这里插入图片描述

进阶语法对于新手来说基本用不到,之后有机会单独讲解。

ok,那讲解完这些概念之后,我们开始真正的输入提示词,先输入正向提示词,其实也很简单,你可以按照我给出的提示词模板,从下往下一个一个去输入即可,这里我输入的是:

1girl, solo focus, tall female, grey hair, very long hair, purple eyes, large breasts, wide hips, sharp face, jewel-like eyes, serious, tired, wearing long grey coat, black blazer, black legwear, stylish sneakers, accessories, smartwatch, flower hair ornament, cute smile, sitting, cafe, coffee shop ambience, coffee shop aesthetic, snow on window, dawn, window view, massive cityscape, beautiful view, dim-lit ambience, holding coffee, {correct posing}, {detailed clothing}, {detailed body}, {correct body anatomy}, {extremely beautiful and delicate anime face and eyes}, {minute details}, {intricate details}, {delicate}, (masterpiece), (best quality), (wallpaper), (8k hd),

然后输入反向提示器,这个一般是有模板的,可以参考其他大佬的,这里我输入的是

extra fingers,fewer fingers,(low quality, worst quality:1.4), (bad anatomy), (inaccurate limb:1.2),bad composition, inaccurate eyes, extra digit,fewer digits,(extra arms:1.2), easynegative

输入好提示词后,就需要输入出图参数来控制图片质量,大小,生成数量等,下面详细介绍一下出图参数。

出图参数

采样迭代步数

采样迭代步数就是 AI 从噪点图到生成最终图片中间的一个步数,所以步数越多,生成出来的图片越清晰;不过增加步数意味着计算时间也会增加,当采样步数大于20之后,画面的提升并不明显,因此默认采样步数都是20。

采样方法

可以理解为AI 生成图像过程中采用的方法,web UI 提供了很多种方法,不过最常用的也就其中四五种。

Euler的适合生成插画风格,生成的图片比较朴素;DPM2M和2MKarras速度较快;SDE Karras 细节会较为丰富。这些方法的特征都是相对而言的,并不一定准确,还和提示词和模型有关。

采样方法更加推荐带加号的,这些方法都是经过改进的,更加优秀。同时,有些大模型会推荐算法,照做即可。

图片大小设置

图片大小默认为 512*512像素,而将宽度和高度修改到1024像素后,即使是在相同模型和提示词下,像素的图片质感也会更好;但是也不能将图片像素设置的过大,一是你的显显卡显存可能不够,二是图片太大容易出现多手多脚等异常情况,这是因为训练模型的时候更多的是使用分辨率较小的图片。

所以一般方法为使用默认图片大小 512*512像素,同时勾选高清修复,本质为将生成的图片再经过一次图生图,将图片放大,后续会专门针对图片高清化进行讲解。

提示词引导系数

提示词引导系数和之前的提示词权重是一个道理,提示词引导系数的安全范围是7到14。

生成次数和生成数量

生成次数是针对相同的模型和提示词,生成多少次。而生成数量是一次生成几张图片。这里更推荐的是提高生成次数而非生成数量,因为提高生成数量的方法是将多张图片拼在一起,看成一张更大的图片去画的,对设备的要求比较高;而提高生成次数只是将生成图片的步骤重复多次而已,对设备的要求没有这么高。

OK,详细介绍完出图参数之后,我们开始实际的去输入出图参数,这里我输入的是:

Sampler:DPM++ 2M Karras CFG scale:7 Steps:20 Clip skip:2

给一张全图如下:

右边这张图片就是生成结果,可以看出还是很不错的。我们也可以多生成几次,看看效果。

OK,这次的实战就到这里结束了,更多的是起一个抛砖引玉的效果,只有你真正去自己做图,才能知道如何去写提示器和出图参数。

AI工具SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,无需自行查找,有需要的小伙伴文末扫码自行获取。

写在最后

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

标签:Diffusion,AI,AIGC,生成,提示,Stable,输入,图片
From: https://blog.csdn.net/AA1213888/article/details/140518357

相关文章

  • Stable Diffusion【进阶篇】:真人漫改之IP-Adapter实现
    大家好,今天我分享真人漫改实现方式:借助ControlNet的IP-Adapter控制模型,IP-Adapter控制模型是由腾讯研究院出品的一个新的ControlNet模型,关于该模型可以理解为图片提示词,类似于MD垫图的效果,但是比tagger标签器提取出图片的元素构成效果更好。它不仅参考图片的风格、光影特效......
  • 人工智能AI已经在改变职场
    如果说无人驾驶出租车现在还是人们口中的傻子,来看看AI绘画后相关职场的故事。AI入侵占到一个行业的大部分,并不遥远,也不缓慢。AI的影响力不仅仅局限于游戏美术领域,也将影响客服、文秘和其他行业。AI绘画工具国际劳工组织(ILO)的研究表明,人工智能(AI)正在悄然改变着全球的就业......
  • AI绘画可以通过这四种方式盈利变现
    市场上涌现出许多利用AI绘画吸引用户并实现盈利的方式。相信很多朋友已经有所耳闻,然而如何将其转化为真金白银却令人摸不着头脑。今天,我们将为大家详细揭示这个项目的操作秘籍,它具备低门槛、简单易行、变现潜力无限的特点,就像是为你奉上一个赚钱的锦囊妙计。一、什么是AI......
  • Stable Diffusion ControlNet垫图:IP-Adapter实现图片风格迁移
    IP-Adapter实现的SD垫图功能对我们的图片处理非常有用,后面我们会进行一系列IP-Adapter的应用分享,通过具体的实例真正看到IP-Adapter的强大。文章使用的AI工具SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,无需自行查找,有需要的小伙伴下方扫......
  • AI绘画赚钱的机会多到你无法想象
    所有的AI设计工具,模型和插件,都已经整理好了,下方扫码即可免费获取噢~家人们,AI绘画带来的变现方式真的太多了!我们圈内目前更新的AI绘画赚钱信息差,已经累计330条!而且每天都在挖掘2-10条最新最火的蓝海项目。很多人会认为AI还没有落地,也有很多人认为这些宣扬AI红利的自媒体......
  • Stable Diffusion|IP-Adapter 图片风格迁移
    文末扫码可获取IP-Adapter插件!前段时间腾讯发布了一个新的ControlNet模型叫“IP-Adapter”,它的作用就是把上传的图像转化为图像提示词,简单的来说就是跟Midjourney的垫图功能差不多。IP-Adapter能够精准地识别参考图的风格特征,并且可以很好的适配其他的模型以及ControlNet......
  • 【DataWhale AI夏令营】--Task 2
    目录1.赛题任务2.baseline代码(1)第一步:导入所需模块(2)探索性数据分析(EDA)(3)数据可视化(4)合并训练数据和测试数据,进行一些数据预处理操作,然后重新切分出训练集和测试集(5)模型训练与测试集预测3.运行结果优化方向优化代码优化总结优化要点总结1.赛题任务使用进阶的机......
  • QT利用QPainter实现自定义圆弧进度条组件
               在可视化应用中,弧形进度条应用也比较广泛,本文示例封装了一个可复用、个性化的弧形进度条组件。本文示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。主要结构就是外围一圈圆角进度,中间加上标题和对应进度的百分比,进度条的起始角......
  • 【AI应用探讨】—生成对抗网络(GAN)应用场景
    目录1.图像生成2.数据增强3.图像编辑与风格转换4.视频生成5.游戏设计6.其他领域1.图像生成应用场景:艺术创作:艺术家和设计师使用GAN生成的图像作为创作的灵感,创造出新颖、独特的艺术品。GAN可以生成具有特定风格的画作,如油画、水彩画等,为艺术创作提供新的可能......
  • 猫头虎分享已解决Bug ||Asset validation failed (90296) App sandbox not enabled. T
    ......