首页 > 其他分享 >AI绘画Stable Diffusion必看:如何生成人物的全身照实战教程!

AI绘画Stable Diffusion必看:如何生成人物的全身照实战教程!

时间:2024-06-11 11:30:25浏览次数:9  
标签:Diffusion body full 必看 AI AIGC 全身 宽高比 图片

大家好,我是画画的小强

在小伙伴们私下留言中,关于如何实现人物的全身照一直有人咨询,看来这个问题还是困惑着不少小伙伴,今天我们就这个问题详细讨论一下。

一. 宽高比参数设置

在讨论如何生成图片的全身照之前,我们先来讨论一下Stable Diffusion中宽高比的参数设置。

这2个参数对于最终的出图有非常大的影响。很多小伙伴因为这2个参数的设置不合理导致出来的图片效果很奇怪。

下面是一些小伙伴使用SD1.5的大模型(如majicMIX realistic 麦橘写实_v7)设置不合理的宽高比出的图。

宽高:1080*1920(制作9:16图片)

下面我们重点看一下常用的SD V1.5和SDXL大模型下宽高比的正常设置范围。

对于SD V1.5 模型最优的宽高比:512x512。下面是常用的宽高比:

  • 1:1(正方形):512x512、768x768

  • 3:2(横向):768x512

  • 2:3(纵向):512x768

  • 4:3(横向):768x576

  • 3:4(纵向):576x768

  • 16:9(宽屏):912x512

  • 9:16 (竖屏): 512x912

对于 SDXL 模型最优的宽高比:1024*1024。下面是常用的宽高比:

  • 1:1(正方形):1024x1024、768x768

  • 3:2(横向):1152x768

  • 2:3(纵向):768x1152

  • 4:3(横向):1152x864

  • 3:4(纵向):864x1152

  • 16:9(宽屏):1360x768

  • 9:16(竖屏):768x1360

宽高比设置注意:

  • 宽度和高度最好能被 8 整除。

  • 记住常用比例:1:1, 2:3(3:2)、3:4(4:3)、9:16(16:9)

  • 如果使用基于SD1.5大模型出图分辨率小的话,可以使用后期放大处理(2倍或者4倍)的方式将图片高清放大。

重点说明: 目前最多的问题是使用基于SD1.5的大模型,将生成图片宽高参数值设置为超过1024大小导致生成的图片千奇百怪,甚至大家参照大模型的案例图片在参数设置完全一致的情况下,图片的效果仍然相差甚远。

主要是很多大模型的案例图片经过了后期放大处理,导致图片宽高超过1024,其实在他们生成图片的时候,都是在正常宽高比参数值下生成的。有些小伙伴不了解相关机制,将后期放大的图片宽高当做生成图片时的宽高参数设置,这样就最终导致生成的图片和案例图片效果相差甚远了。


二. 人物的全身照

关于人物全身图处理方式的几种思路。

(1)在正向提示词中添加关键词full body或者full body shot等

(2)如果没有效果,加大关键词的权重 (full body:1.2) 或者(full body:1.5)

(3)如果还是没有效果,适当调整一下图片的宽高设置,将图片的高度调整为图片的宽度的1-2倍,例如生成图片的宽高比设置为3:4。

(4)如果都没有效果,针对我们使用的大模型,在官网看一下详细的说明,有没有对出全身图有这样的限制,或者看一下官网放出的那几张金典的图片,是否可以作出全身图片,然后看一下提示词以及相关参数设置。

下面我们以下面的文生图为例对上面的关键点展开说明。

  • 大模型:万享XL_超写实摄影V8.2

  • 采样器:Euler a

  • 采样迭代步数:25

  • CFG:3

  • 正向提示词:1 super beautiful chinese girl,solo,(full body:1.5),

  • 反向提示词:NSFW,EasyNegative,badhandv4,

  • ng_deepnegative_v1_75t,16-token-negative-deliberate-neg,bad_prompt_version2,ugly,deformed,bad anatomy,low quality,

关于万享XL模型下载请扫描获取哦

full body(全身)关键词的理解

这里以图片宽高1024*1024来说明

一般来说,在提示词中我们使用full body关键词,可能想到的图片效果如下。
在这里插入图片描述

这种是最理想的图片效果,以人物站立姿势来展示全身图的。

由于我们并没有在提示词里面指定人物的姿势,所以使用full body关键词有时候出来的图片效果并不都是站立姿势,比如下面的图片。

坐姿的全身图

躺姿的全身图

身体向前倾的全身图

总结:

(1)关键词full body表示的全身含义,可能包含人物的多种姿势的全身,比如站立、坐姿、躺姿等。所以,如果有时候要表达更为准确的全身含义,需要补充人物姿势的关键词。

(2)关键词full body表示的全身并不一定都是从头到脚都展示。很多时候可能都是大腿以上的部分。

(3)不同的模型对于关键词full body的理解也不一样,有些模型使用full body出图都是站立的全身照,并且从头到脚。比如下面是majicMIX realistic 麦橘写实_v7版本出的图片(提示词和上面一样,宽高为512*512)。

宽高参数值对人物全身照的影响

我们仍然以上面的示例为例,我们将宽高参数值调整为1024*512。

针对万享XL_超写实摄影V8.2,我多次生成了图片,每次图片效果都只有人物的半身照。

这说明,图片的宽高设置对于人物的全身照还是有影响的,如果我们图片的宽高设置不合理,例如本示例中将图片的宽度设置为高度的2倍,出全身图的概率可能会非常小,所以为了更好的实现人物的全身图,可以适当调整图片的宽高设置,将高度调整到宽度1-2倍。

很多时候,将图片的高度设置比宽度大,出现全身照并且人物站立姿势的概率要大很多。

另外,有些摄影的角度可能也会生成人物的全身照,并不需要借助关键词full body, 大家也可以了解一下,当然这些就不在我们讨论的范围之内。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

标签:Diffusion,body,full,必看,AI,AIGC,全身,宽高比,图片
From: https://blog.csdn.net/A1353192296/article/details/139594041

相关文章

  • 一文了解AI绘画两大鼻祖 Midjourney 和 Stable Diffusion的区别,超详细讲解小白入门必
    大家好,我是画画的小强要说AI绘画软件哪家强?有人说Midjoureny(MJ),有人说StableDiffuion(SD),那他们到底有什么区别?应该选择哪款软件学习?今天带大家全面了解一下!文末可白嫖AI资料哦~一.使用费用对比Midjourney的收费为每月8-120美金不等,折算成RMB为60-880左右。分为4......
  • Python集成开发环境(IDE)JetBrains pycharm pro 2024 for mac
    JetBrainsPyCharmPro2024确实是一款强大的Python集成开发环境(IDE),为Python开发者提供了许多高级功能和改进,旨在提高开发效率和代码质量。以下是对您提到的PyCharm2024新增功能的详细解释:Python集成开发环境(IDE)软件地址HuggingFace模型和数据集的文档预览PyCharm2024......
  • OpenWrt安装配置Tailscale
    什么是tailscale?Tailscale就是基于Wireguard的一个联网工具,无需公网地址,通过去中心化,实现各个节点之间点对点的连接.配置简单友好,支持的各类平台和客户端.相比较其他组网工具的优势是什么?对比zerotier和wireguard,wireguard更容易连上官方的中转服务器,webui界面更简单,适合......
  • 2024年高考作文题目人工智能,热门AI
    当今社会的发展越来越迅速,人工智能也逐步走进我们的生活,连今年的高考作文题目也是人工智能高考作文:新课标I卷阅读下面的材料,根据要求写作。(60分)随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你......
  • 艺术之门,由AI轻启
    在数字与美学交织的世界里,Ai画廊以其独特的AI关键词生成器,为艺术创作打开了一扇便捷之门。这里,无论是东方山水画的意境,还是特写照片中的精细五官,每一种风格和主题都能通过简单的描述被精准捕捉,转化为一幅幅令人赞叹的作品。Ai画廊的魔力,在于它能够理解并深化您的创意,提供从传......
  • 写一个多线程控制工人接活和工作的例子(使用synchronized wait notifyAll)
    packageorg.example;publicclassStudyWaitAndNotify{publicstaticvoidmain(String[]args){WorkManNeedToDoa=newWorkMan();Leaderl1=newLeader(a,25);Leaderl2=newLeader(a,20);Testert1=newTester(a......
  • vs2022 AI插件 通义灵码
    一.推荐灵码推荐地址和官网介绍https://developer.aliyun.com/topic/lingma/activities/202405?taskCode=16245&recordId=25d6bfc41bf0b67809848dd90cf62ad6#/?utm_content=m_fission_1二.公测安装由于目前还是公测阶段所以官网还未展示vs2022的介绍后面公测结束了可以直接点......
  • 聊聊如何利用Testcontainers进行集成测试
    前言1、何为Testcontainers?Testcontainers是一个库,它为引导本地开发和测试依赖关系提供了简单而轻量级的API,并将真实的服务封装在Docker容器中。使用Testcontainers,您可以编写依赖于您在生产中使用的相同服务的测试,而不需要mock或内存服务。用比较直白的话就是testcontainers......
  • 苹果终于要推出真正的 Siri 了吗?|TodayAI
    苹果的语音助手本来应该是一个超越当前形态的存在。现在,13年后,它可能真的准备好了。2011年,苹果与 iPhone 4S一同推出了 Siri。公司发布了一系列广告,展示了如何使用这个新奇的语音助手。这些广告展示了Siri可以完成提醒、天气预报、闹钟等多种任务。广告的重点是Siri......
  • 解决Vue项目Network: unavailable的问题
        在vscode使用npmrunserve运行Vue项目时发现一个问题,项目只能通过Local访问而不能通过Network访问,终端显示如下:    碰到这种情况的解决方法:在环境变量的path中添加“C:\Windows\System32\Wbem”1.找到“环境变量”:设置-->系统-->高级系统设置-->环......