首页 > 其他分享 >Stable Diffusion AI 绘画使用

Stable Diffusion AI 绘画使用

时间:2023-07-14 09:45:33浏览次数:44  
标签:Diffusion 采样 eye AI 模型 生成 Stable Prompt

界面参数

  • 在使用 Stable Diffusion 开源 AI 绘画之前,需要了解一下绘画的界面和一些参数的意义
  • 目前 AI 绘画对中文提示词的效果不好,尽量使用英文提示词
  • 最主要一些参数如下:
  • Prompt: 正向提示词,也就是 tag,提示词越多,AI 绘图结果会更加精准
  • Negative prompt: 反向提示词,也就是反向 tag
  • Width / Height:要生成的图片尺寸。尺寸越大,越耗性能,耗时越久。
  • CFG scale:AI 对描述参数 Prompt 的倾向程度。值越小生成的图片越偏离你的描述,但越符合逻辑;值越大则生成的图片越符合你的描述,但可能不符合逻辑。
  • Sampling method: 采样方法。有很多种,但只是采样算法上有差别,没有好坏之分,选用适合的即可。
  • Sampling steps: 采样步长。太小的话采样的随机性会很高,太大的话采样的效率会很低,拒绝概率高
  • Seed: 随机数种子。生成每张图片时的随机种子,这个种子是用来作为确定扩散初始状态的基础。不懂的话,用随机的即可
  • Restore faces: 面部修复,优化面部的,原理是调用一个神经网络模型对面部进行修复,影响面部。修复画面中人物的面部,但是非写实风格的人物开启面部修复可能导致面部崩坏
  • Tiling: 无缝贴图,是一种老牌优化技术,即 CUDA 的矩阵乘法优化,影响出图速度和降低显存消耗,不过实际选上之后可能连正常的图都不出来了。打死不开
  • Highres.fix: 高分辨率修复,默认情况下,文生图在高分辨率下会生成非常混沌的图像。如果使用高清修复,会型首先按照指定的尺寸生成一张图片,然后通过放大算法将图片分辨率扩大,以实现高清大图效果

 

采样器

  • Euler a: 是个插画,tag 利用率仅次于 DPM2 和 DPM2 a,环境光效菜,构图有时奇葩
  • Euler: 柔和,也适合插画,环境细节与渲染好,背景模糊较深
  • Heun: 单次出土平均质量比 Euler 和 Euler a 高,但速度最慢,高 step 表现好
  • DDIM: 适合宽画,速度偏低,高 step 表现较好,负面 tag 不够时发挥随意,环境光线与水汽效果好,写实不佳
  • DPM2: 该采样方式对 tag 的利用率最高,几乎占用 80% 以上
  • DPM2 a: 几乎与 DPM2 相同,只是在人物的时候可能有特写
  • PLMS: 单次出图质量仅次于 Heun
  • LMS: 质感 OA,饱和度与对比度偏低,更倾向于动画风格
  • LMS Karras: 会大改成优化的风格,写实不佳
  • DPM fast: 此为上界开发者所遗留的测试工具,不适合魔术师使用

 

文生图(txt2img)

  • 文生图(text2img): 根据提示词 Prompt 的描述生成相应的图片
  • 选择 绘画模型(Stable Diffusion checkpoint) ► 文生图(txt2img) ► 填写正向提示词(Prompt) ► 填写反向提示词(Negative prompt)► 选择采样器(一般选择DPM++ 2M Karras) ► 设置采样步骤(一般设置30) ► 设置长宽(Width / Height,推荐 1024 * 1536) ► 点击生成(Generate)
  • 根据上面的步骤,即可通过文字生成图片了,一般我们只要编写 Prompt 即可, Negative prompt 一般都是固定的,限制一下水印,低质量以及其他可能出现的逻辑错误即可

 

图生图(img2img)

  • 图生图(img2img): 将一张图片根据提示词 Prompt 描述的特点生成另一张新的图片
  • 选择 绘画模型(Stable Diffusion checkpoint) ► 图生图(img2img) ► 填写正向提示词(Prompt) ► 填写反向提示词(Negative prompt)► 选择采样器(一般选择DPM++ 2M Karras) ► 设置采样步骤(一般设置30) ► 设置长宽(Width / Height,推荐 1024 * 1536) ► 点击生成(Generate)
  • 将上传一张图片到图生图中,进行测试一下,这里使用的是刚刚文生图的照片,根据上面的步骤,点击生成,看看效果
  • 可以看出:AI 图生图,其实就是根据你上传的图片和你的 Prompt 生成一张跟上传差不多的照片

 

标签权重

  • 在输入 Prompt 标签的时候,有时候想到啥就会写啥,默认写在前面的权重会最高
  • 在 stable Diffusion 中也可以通过特定符号提升关键词的权重
  • 其中 () 是加强权重,[] 是降低权重,{} 是 NAI 对 () 的“实现”,<> 用于嵌入
  • 例如:(eye) > [eye](eye:1.4) 会比正常情况多增加约 40%(eye:0.6) 会减少约40 %
# 默认关键词是1.1倍
(eye) = (eye:1.1)
((eye)) = (eye:1.21)
(((eye))) = (eye:1.331)
((((eye)))) = (eye:1.4641)
(((((eye)))) = (eye:1.61051)
((((((eye)))))) = (eye:1.771561)
[eye] = (eye:0.9090909090909091)
[[eye]] = (eye:0.8264462809917355)
[[[eye]]] = (eye:0.7513148009015778)
[[[[eye]]]] = (eye:0.6830134553650707)
[[[[[eye]]]]] = (eye:0.6209213230591552)
[[[[[[eye]]]]]] = (eye:0.5644739300537775)

模型下载

  • 模型网站推荐:https://civitai.com/
  • 左上角的下拉框可以用来选择模型,其中 v1-5-pruned-emaonly.safetensors 是默认模型
  • 默认的模型画出来的图片比较丑,所以我们需要下载更好更适合的模型来绘画
  • 每个模型侧重绘画的风格不一样,有些适合画人,有些适合画动漫,有些适合画风景,根据自己的需求选择适合自己的绘画风格模型进行下载
  • 下载好模型,将模型文件放入到 models/Stable-diffusion 文件夹下,重载 UI,即可看到

 

标签:Diffusion,采样,eye,AI,模型,生成,Stable,Prompt
From: https://www.cnblogs.com/tdskee/p/17552822.html

相关文章

  • 首个!AI开发者创作激励计划开启,有成长、有收入
    各种视频网站都有什么创作激励!那什么时候有专属于AI开发者的创作激励?好!那AI开发者的福利来了!!既能潜心进行模型开发,又能提升技术能力,还能领一份创作金!!飞桨AIStudio全新发布首个面向AI开发者的创作激励期待持续与你相伴AI之路,见证彼此的成长什么是创作激励体系飞桨AIStudio创建至今......
  • 我在阴影之中-InsCode Stable Diffusion 美图活动一期
    写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益......
  • 击败Stable Diffusion XL,商汤绘画大模型出手即大作,论文公开、免费试玩
    前言 商汤大模型团队提出的文生图大模型RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。本文转载自机器之心仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各......
  • [GIT]解决:failed to push some refs to ...(过程重现)
    本问题有很多种情况,解决方法也很多,本文只针对笔者本人的自身诉求和情况,选择了一种适合我的解决方法。仅供参考。1问题描述johnnyzen@XXDSSSMINGW64/e/source_code/BigData/bdp_common_data_service(develop)$gitpushTogitlab-bigdata.johnnyzen.cn:platform-software/b......
  • AI学英语,背英语单词
     英语作为全球最广泛使用的语言之一,在全球商业、科研、教育等领域起着至关重要的作用。随着技术的发展,人们对英语的学习方式进行了革新,而OpenAI推出的ChatGPT和GPT-4技术就是学习英语的一种新选择。#ChatGPT和GPT-4:新一代AI辅助学习工具首先,了解ChatGPT和其后续版本GPT-4的基......
  • RTC+AI|“即智”数智人创新内容生产体验,为企业降本增效再提速
    号称“史上最卷”的618年中大促落下帷幕,几大电商巨头在直播投入和短视频内容建设上持续加码,短视频+直播电商的营销模式成为618期间的主要输出。以某美妆专场直播间为例,主播现场手把手教用户化妆技巧。这些内容原先就在短视频的美妆领域很受用户欢迎,而直播间将美妆教学过程场景化,......
  • Altair SimSolid三维结构分析工具 衡祖仿真
    1、不需要对几何图形进行简化这个功能可以说是非常强大。众所周知,有限元结构仿真最花时间的莫过于在几何的前处理上。很多时候,要么CAD文件是一个巨大的组装件,成千上万个零件。你需要对组装件进行必要的简化和取舍,不然根本没法跑分析。有时候CAD文件本身就有很多几何错误,经......
  • WPF获取MainWindows实例
    WPF获取MainWindow实例在其他类中获取MainWindow实例,获取其控件,改变其控件属性等,代码如下:_mainWindow=Application.Current.Windows.Cast<Window>().FirstOrDefault(Window=>WindowisMainWindow)asMainWindow;例如在ConfigureViewModel中改变MainWindow中的某个TextB......
  • 从大数据到AI,华为云存储加速企业大模型快速应用
    摘要:AI与大数据算法不断发展,在生产中的应用也越来越广,而应用的场景除了对算法,软件架构要求越来越高外,也对底层IaaS(基础设施即服务)提出了新的挑战。AI与大数据算法不断发展,在生产中的应用也越来越广,而应用的场景除了对算法,软件架构要求越来越高外,也对底层IaaS(基础设施即服务)提出了......
  • Email代表发送
    一、代表发送1、需实现如图所示的功能: 答复时直接答复被代表者 2、参考资料https://stackoverflow.com/questions/44402582/send-email-using-on-behalf-of-using-apache-common-emailhttps://stackoverflow.com/questions/27343725/com-sun-mail-smtp-smtpsenderfailede......