首页 > 其他分享 >Diffusers代码学习: T2I Adapter

Diffusers代码学习: T2I Adapter

时间:2024-06-09 22:04:31浏览次数:21  
标签:T2I Adapter torch Diffusers 图像 import image

T2I Adapter是一款轻量级适配器,用于控制文本到图像模型并为其提供更准确的结构指导。它通过学习文本到图像模型的内部知识与外部控制信号(如边缘检测或深度估计)之间的对齐来工作。

T2I Adapter的设计很简单,条件被传递到四个特征提取块和三个下采样块。这使得针对不同的条件快速而容易地训练不同的适配器,这些适配器可以插入到文本到图像模型中。T2I Adapter与ControlNet类似,只是它更小(约77M个参数),速度更快,因为它在扩散过程中只运行一次。缺点是性能可能比ControlNet稍差。

文本到图像模型依赖于提示来生成图像,但有时,仅凭文本可能不足以提供更准确的结构指导。T2I Adapter允许您提供额外的控制图像来指导生成过程。例如,您可以提供一个Canny的图像(黑色背景上图像的白色轮廓)来引导模型生成具有类似结构的图像。

# 以下代码为程序运行进行设置

import os
os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"
mport cv2
import numpy as np

from PIL import Image

# 程序需要能够支持加载图片

from diffusers.utils import load_image

# 以下代码加载边缘检测图的原型图片

image = load_image("https://hf-mirror.com/datasets/hf-internal-testing/diffusers-images/resolve/main/sd_controlnet/hf-logo.png")

image = np.array(image)

low_threshold = 100
high_threshold = 200

# 以下代码生成边缘检测图

image = cv2.Canny(image, low_threshold, high_threshold)

image = Image.fromarray(image)
 

# 以下代码加载StableDiffusionAdapter自动管道,及T2I Adapter
import torch
from diffusers import StableDiffusionAdapterPipeline, T2IAdapter

adapter = T2IAdapter.from_pretrained("TencentARC/t2iadapter_canny_sd15v2", torch_dtype=torch.float16)
pipeline = StableDiffusionAdapterPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    adapter=adapter,
    torch_dtype=torch.float16,
)
pipeline.to("cuda")

# 以下代码加载并处理提示词,基于边缘检测图生成图片

generator = torch.Generator("cuda").manual_seed(0)


image = pipeline(
prompt="cinematic photo of a plush and soft midcentury style rug on a wooden floor, 35mm photograph, film, professional, 4k, highly detailed",
image=image,
generator=generator,
).images[0]

image.show()

以下是边缘检测图的原型图片

图片

以下是边缘检测图的原型图片

图片

以下是生成的图片

图片

标签:T2I,Adapter,torch,Diffusers,图像,import,image
From: https://blog.csdn.net/duhaining1976/article/details/139566777

相关文章

  • Diffusers代码学习: IP-Adapter(续)
    但是IP-Adapter不仅可以通过文生图的方式,也可以通过图生图的方式生成目标图片,就无需使用提示词。只不过同上一篇所述,底层的逻辑和图生图是完全不同的。# 以下代码为程序运行进行设置,使用图生图的自动管道,importosos.environ["HF_ENDPOINT"]="https://hf-mirror.com" ......
  • Android Adapter中组件EditText文本变化监听 addTextChangedListener
    问题背景:使用适配器显示一个列表,列表中Item中有EditText,滚动时会有EditText组件内容消失步骤:1.在Adapter中,添加interfacepublicinterfaceOnEidtTextChangeListener{ voidxxxTextChanged(CharSequences,intstart,intbefore,intcount); voidgetXxxEditedCount(......
  • adapter1.1.5不能同步数据到ES6
    问题:如果修改数据库某张表的某个字段时出现如下日志:2024-06-0415:32:18.177[pool-2-thread-1]DEBUGc.a.o.canal.client.adapter.es.core.service.ESSyncService-DML:{"data":null,"database":"aws","destination":"CANAL_GOODS","e......
  • 深入解读Prometheus Adapter:云原生监控的核心组件
    本文详述了PrometheusAdapter的部署与配置,通过三个实践案例展示其在Kubernetes环境中的应用,帮助用户实现基于自定义指标的自动扩展和跨集群统一监控。关注作者,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室......
  • dbt adapter dispatch 处理简单说明
    以前是结合使用对于adapter的dispatch有过简单说明,以下结合源码分析下内部参考处理参考处理defdispatch(self,macro_name:str,macro_namespace:Optional[str]=None,packages:Optional[List[str]]=None,#eventuallyremove......
  • lora_adapter 模型和原模型合并成一个模型
    lora部分合并到原模型参数上importtorchfrompeftimportPeftModelfromtransformersimportAutoTokenizer,AutoModelForCausalLM,LlamaTokenizerfromtransformers.generation.utilsimportGenerationConfigdefapply_lora(model_name_or_path,output_path,lor......
  • 设计模式:适配器模式(Adapter)
    设计模式:适配器模式(Adapter)设计模式:适配器模式(Adapter)模式动机模式定义模式结构时序图模式实现在单线程环境下的测试在多线程环境下的测试模式分析优缺点适用场景应用场景应用实例适配器模式和代理模式的区别模式扩展默认适配器模式(DefaultAdapterPattern)接口适配器模......
  • Scan Your Truck Using Nexiq Adapter: Simplifying Your Diagnostic Process
    Intoday'sfast-pacedworld,ensuringthesmoothfunctioningofyourtruckisessentialforavoidingdowntimeandmaintainingefficiency.Withtheadventofadvancedtechnology,diagnosingandtroubleshootingissueshasbecomemoreconvenientthanev......
  • dbt adapter 的get_relation 简单说明
    dbt的adapter.get_relation可以方便的获取存在的relcation信息,以下是一个简单说明参考实现内部处理@available.parse_nonedefget_relation(self,database:str,schema:str,identifier:str)->Optional[BaseRelation]:relations_list=self.lis......
  • ComfyUI使用基础工作流+面部adapter修复
    json{"last_node_id":13,"last_link_id":19,"nodes":[{"id":6,"type":"CLIPTextEncode","pos":[415,186],"size&qu......