首页 > 其他分享 >Stability.AI 发布 SD3.5 模型,能否逆袭击败 FLUX?如何在ComfyUI中的使用SD3.5?

Stability.AI 发布 SD3.5 模型,能否逆袭击败 FLUX?如何在ComfyUI中的使用SD3.5?

时间:2024-10-24 17:19:12浏览次数:10  
标签:Diffusion AI ComfyUI 模型 提示 3.5 SD3.5 Stable

就在前天,Stability AI 正式发布了 Stable Diffusion 3.5版本,包括 3 款强大的模型:

  • Stable Diffusion 3.5 Large:拥有 80 亿参数,提供卓越的图像质量和精确的提示词响应,非常适合在 1 兆像素分辨率下的专业用例。
  • Stable Diffusion 3.5 Large Turbo:这是 Large 模型的加速版本,仅需 4 步即可生成高质量图像,速度更快。
  • Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):拥有 26 亿参数,针对消费级硬件进行了优化,可在 0.25 到 2 兆像素分辨率下表现出色。

这些模型在 Stability AI 社区许可下免费供商业和非商业使用。

模型下载地址

在这里插入图片描述

模型特点

Stable Diffusion 3.5 在以下几个方面表现出色,成为市场上最具可定制性和可访问性的图像模型之一,同时在提示词响应和图像质量方面保持了顶尖水平:

  1. 可定制性:可以轻松微调模型以满足您的特定创作需求,或基于定制化工作流构建应用程序。
  2. 高效性能:经过优化,能够在标准消费级硬件上运行,尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 模型。
  3. 多样化输出:无需复杂提示词,即可生成代表不同肤色和特征的图像,涵盖全球多样性。
  4. 多样风格:支持生成多种风格和美学,如 3D、摄影、绘画、线条画及几乎任何视觉风格。

此外,分析表明,Stable Diffusion 3.5 Large 在提示词响应性方面领先市场,并在图像质量上媲美更大规模的模型。Stable Diffusion 3.5 Large Turbo 在同类模型中具有最快的推理时间,同时在图像质量和提示词响应性方面仍具竞争力,即便与未精简的同类大小模型相比也是如此。

Stable Diffusion 3.5 Medium 超越了其他中型模型,在提示词响应性和图像质量方面表现出色,是高效、高质量表现的首选。

下图是官方提供的模型对比,可以看出其在提示词方面是效果最好的,但是美学方面不如Flux。图片

在ComfyUI中的使用

工作流截图

图片工作流下载地址猫目社区:https://maomu.com/workflow/DFVH8NiYXe

在ComfyUI中的使用步骤

第一步:先将ComfyUI更新到最新版本;第二步:将Stable Diffusion 3.5 Large或者Stable Diffusion 3.5 Large Turbo下载到ComfyUI\models\checkpoints 目录下;

以下是官方提供的工作流和模型:https://huggingface.co/stabilityai/stable-diffusion-3.5-large/tree/main图片

第三步:加载 Clip 模型,将将clip_g.safetensorsclip_l.safetensorst5xxl_fp16.safetensors下载到 ComfyUI\models\clip 目录下,(如果之前有下载过的,就不用再次下载)

以下是官方提供的 Clip 模型:https://huggingface.co/stabilityai/stable-diffusion-3.5-large/tree/main/text_encoders图片第四步:将工作流拖入ComfyUI中,如果有缺失的节点那就进行安装。

低内存解决方案

如果在生图的过程中崩溃,可能是内存不足,可以通过以下方法解决:

工作流和模型下载地址:https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/tree/main

图片图片

出图测试:

为了全面比较 FLUX 和 Stable Diffusion 3.5 的出图效果,我们可以比较它们在风格、细节、色彩和构图等方面的差异。覆盖不同风格的提示词,涵盖了写实、插画、3D建模等风格。

写实风格

提示词:A highly detailed, ultra-realistic portrait of a young woman, smooth skin, morning light, deep eyes 中文:高度详细、超现实的年轻女子肖像,光滑的皮肤,晨光,深邃的眼睛

图片

插画风格

提示词:A vibrant and colorful fantasy landscape with towering castles, dragons flying in the sky, and magical creatures in the foreground, in the style of a digital painting 中文:充满活力、色彩缤纷的奇幻景观,有高耸的城堡、飞翔的巨龙、前景中的神奇生物,具有数字绘画的风格

图片

3D 渲染风格

提示词:A highly detailed 3D render of a futuristic city at night, with glowing neon lights, flying cars, and tall skyscrapers, cyberpunk aesthetic. 中文:高度详细的 3D 渲染未来城市的夜晚,闪烁的霓虹灯、飞行的汽车和高耸的摩天大楼,赛博朋克美学。

图片

漫画风格

提示词:A dynamic action scene of a superhero flying through the city, with exaggerated expressions, bold lines, and vibrant comic book colors. 中文:超级英雄飞越城市的动态动作场景,夸张的表情、大胆的线条、充满活力的漫画色彩。

图片

复古风格

提示词:A sepia-toned, 1920s vintage photograph of a couple dancing in an elegant ballroom, with antique decor and dim lighting. 中文:一张深褐色色调的 1920 年代复古照片,照片上是一对情侣在优雅的舞厅跳舞,舞厅拥有古色古香的装饰和昏暗的灯光

图片

极简风格

提示词:A minimalist black and white abstract line art of a cat, clean lines and simple shapes. 中文:一只猫的简约黑白抽象线条艺术,干净的线条和简单的形状

图片

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

标签:Diffusion,AI,ComfyUI,模型,提示,3.5,SD3.5,Stable
From: https://blog.csdn.net/Trb201013/article/details/143214705

相关文章

  • 第一批用AI的设计师,已经彻底赚翻了!
    2024年,你一定要学会用AI设计**。**1年时间,AI证明了它的超强设计能力:不用PS,一键完成抠图、扩图;不用绘图,几个字描述,轻松生成****矢量图标、3D插画****;不用付费,分分钟生成虚拟人物图像,不用担心版权;不用3D软件,几个关键词咒语把线稿转3D;用好AIGC,等于你多了20个“隐形设计......
  • 真AI遇到招聘管理系统,帮助企业打造新质生产力
    知名科技杂志《连线》创始主编凯文·凯利曾预测:“在未来的100年里,人工智能将超越任何一种人工力量,将人类引领到一个前所未有的时代。”确实如此,随着近两年AIGC与大模型的快速爆发,AI在千行百业中的重要性愈发突出,它不但让众多行业迎来了被深度重构的新阶段,同时也成为了驱动新......
  • 【AI+手机】如何利用GPT实现Android软件自动化交互?全面解读MetaGPT Android助手实现原
    大家好,我是同学小张,+v:jasper_8017一起交流,持续学习AI大模型应用实战案例,持续分享,欢迎大家点赞+关注,订阅我的大模型专栏,共同学习和进步。前段时间,AI+手机的组合挺火的。想象一下,你想给某个人发短信,只需要对手机说一句:给xxx发个短信问好。AI自动识别意图,自动给你打开......
  • DirectX Repair(DirectX修复工具)V4.3增强版
    DirectX修复工具(DirectXRepair)是一款系统级工具软件,简便易用。本程序的主要功能是检测当前系统的DirectX状态,如果发现异常则进行修复。程序主要针对0xc000007b问题设计,可以完美修复该问题。本程序中包含了最新版的DirectXredist(Jun2010),并且全部DX文件都有Microsoft的数字......
  • 可灵AI - AI图片_AI视频
    一、产品描述可灵AI是由快手推出的一款先进的AI应用,它集成了视频生成、图像生成、虚拟试穿等多种功能于一体,旨在为用户提供高效、便捷的AI创作体验。用户可以通过可灵AI快速生成视频、图片等多媒体内容,并支持自助训练人脸模型,实现个性化内容的定制。此外,可灵AI还提供了丰富的A......
  • 非煤矿山算法视频分析服务器皮带运行状态识别视频智能AI分析系统建设方案设计
    一、建设背景近年来,我国在非煤矿山的安全生产方面虽然取得了一定的进展,但整体安全基础仍然不牢固,事故数量依然较多,并且尚未从根本上控制住重大事故的发生,整体安全生产的形势依旧严峻且充满复杂性。根据国家矿山安全监察局发布的《关于煤矿及关键非煤矿山重大灾害风险防控体系建......
  • 创新+1+1+1+1!筑牢算力底座,助推AI产业繁荣发展!
    近日,ICT中国·2024高层论坛-云原生发展论坛在北京国家会议中心举办。天翼云出席《城市算力互联网实践指南》编制工作启动仪式、AICloud人工智能云服务标准体系阶段性成果发布仪式、算力互联网服务能力标准体系正式启动暨《算力互联网服务能力要求个人终端算力(卡)》标准发布仪式......
  • 寻找AI新势力!“天翼云息壤杯”高校AI大赛火热报名中!
    各位高校开发者们, AI舞台已就位,你准备好了吗?为加快落实“人工智能+”行动,中国电信集团有限公司充分发挥央企在人工智能领域主力军作用,联合华为技术有限公司共同举办“天翼云息壤杯”高校AI大赛。重点聚焦国内外AI领域知名院校、头部实验室/课题组,涵盖31省、港澳台及海外,旨在......
  • springboot068桂林旅游景点导游平台(论文+源码)_kaic
    桂林旅游景点导游平台摘要随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了桂林旅游景点导游平台的开发全过程。通过分析桂林旅游景点导游平台管理的不足,创建了一个计算机管理桂林旅游景点导游平台的方案。文章介绍了桂林旅游......
  • AI产品经理 | 入行AI的必备知识
    AI大模型从前年11月开始到现如今,非常火热,无论大厂还是创业新星都在为AI的落地搭建产品架构,并迅速跟进落地铺量,随着业务扩建,市面上也涌现出大量的大模型产品岗位。对于目前在看机会的如果想要入AI坑的话,产品经理要开始做哪些方面的准备工作呢?一、市场摸底调研:市面主要提供A......