首页 > 其他分享 >Cross-Image Attention for zero-shot appearance transfer

Cross-Image Attention for zero-shot appearance transfer

时间:2024-08-14 17:51:40浏览次数:10  
标签:外观 长颈鹿 shot transfer Image 语义 图像 结构图 注意力

 

1.Introduction

探讨appearance transfer的背景下进行图像操作,目标是将一个图像中概念的视觉外观转移到另一个图像中存在的概念上,例如,将斑马的外观转移到长颈鹿上,完成这一任务需要首先将长颈鹿和斑马之间在语义上相似的区域进行关联,然后通过这些关联转移,而不改变长颈鹿的结构。去噪网络的交叉和自注意力机制隐式的编码了从生成图像中提取的强语义信息,基于这些自注意力层中的qkv,采用跨不同图像的自注意力机制,当应用于具有不同形状和结构的不同主题的图像时,这种夸图像注意力在两个图像中形成相似语义区域之间的强关联。

更具体的说,给定一张外观图和一张结构图,首先将这两张图反向转换到一个预训练的文本到图像的扩散模型的隐空间,然后在去噪过程中的每个时间步,通过将与结构图相对应的q乘以外观图像的k来计算修改后的自注意力图,这种跨图像操作在两个图像之间建立了隐式的语义对应关系,而无需额外的监督,将输出的跨图像的注意力图与外观图的v相乘,就可以准确的外观图中的每个像素转移到结构图中相应的,语义相似的像素上。

仅依靠它往往不足以实现两个图像

标签:外观,长颈鹿,shot,transfer,Image,语义,图像,结构图,注意力
From: https://blog.csdn.net/u012193416/article/details/141185943

相关文章

  • [RIS]Contrastive Grouping with Transformer for Referring Image Segmentation-CGFo
    1.BaseInfoTitleContrastiveGroupingwithTransformerforReferringImageSegmentationAdresshttps://arxiv.org/pdf/2309.01017Journal/TimeCVPR2023Author上海科技大学Codehttps://github.com/SooLab/CGFormerRead202408013Table#VisonLanguage#RIS2.CreativeQ......
  • 《ImageNet: A Large-Scale Hierarchical Image Database》李飞飞论文阅读笔记
    OpenSNN开思通智网,官网地址:https://w3.opensnn.com/2024年8月份"O站创作者招募计划"快来O站写文章,千元大奖等你来拿!“一起来O站,玩转AGI!”论文地址:《ImageNet:ALarge-ScaleHierarchicalImageDatabase》这篇论文是关于一个叫做“ImageNet”的大型图像数据库的介绍。......
  • docker之pull失败。error pulling image configuration: download failed after attem
    一、问题描述docker部署完成后,想pull项目,但是就是报错:errorpullingimageconfiguration:downloadfailedafterattempts=6:dialtcp108.160.170.26:443:connect:connectionrefused, 更奇葩的是执行dockersearchhello-world是可以的。二、解决问题1)问题分析:看报......
  • iOS的CoreImage框架技术详解
    CoreImage提供图像处理、人脸识别、图像增强、图像滤镜、图像转场。它操作的数据来自CoreGraphics、CoreVideo、ImageIO,使用CPU或GPU进行渲染。CoreImage对底层实现进行封装,为上层提供简单易用的API。一、CoreImage框架CoreImage框架分为:渲染层、处理层、API层。其中,渲染......
  • SMA2:代码实现详解——Image Encoder篇(FpnNeck章)
    SMA2:代码实现详解——ImageEncoder篇(FpnNeck)总配置YAML文件、OmegaConf和hydraSAM2的官方实现是使用yaml文件来配置整体的模型结构与参数的。关键代码如下:defbuild_sam2(config_file,ckpt_path=None,device="cuda",mode="eval",hydra_overr......
  • CSS3 边框(包含border-radius、border-image与box-shadow)
    CSS3边框样式border-radius作用:设置圆角值的个数及其效果简记:左上开始顺时针,值不够的对角来凑。值的个数效果1四个角一致2左上角和右下角一致,右上角和左下角一致3左上角、右上角和左下角一致、右下角4左上角、右上角、右下角、左下角圆角与椭圆角语法:border-radi......
  • Docker Desktop 出现 Unable to calculate image disk size 错误提示的解决方法
    Win11安装了DockerDestop,版本为4.25.2。DockerDesktop能随系统启动而启动,其内部管理的容器也可以正常启动,但是不和谐的地方也出现了:在从通知区域双击DockerDesktop的图标后,它就会出现如下错误信息,虽不影响使用,但是相当碍眼:  解决方案:【1】进入设置,关闭“UsetheWSL2......
  • c# svg转Bitmap Bitmap转ImageSource
    需要安装nuget包【svg】publicclassSVGHelper{publicstaticImageSourceConvertSvgToDrawingImage(stringpath){varsvgContent=File.ReadAllText(path);//使用SvgDocument解析SVG内容SvgDocumentsvgDoc......
  • 论文笔记:Investigation of Passengers’ Perceived Transfer Distance in Urban Rail
    (基于XGBoost和SHAP的城市轨道交通站点乘客感知换乘距离研究)话题点:城市轨道交通站点、换乘距离、XGBoost模型、SHAP模型:感知传输距离偏差theRatioofPerceivedTransferDistanceDeviation(R)、XGBoost和SHAP模型考虑的因素:乘客个人属性、换乘设施和换乘环境相关的32个指......
  • 使用SixLabors.ImageSharp 进行图片的缩放C#.net core,可跨平台运行
    引用命令空间usingSixLabors.ImageSharp;using SixLabors.ImageSharp.Formats.Png;using SixLabors.ImageSharp.Processing; publicstaticvidResize(byte[]imageBytes,intwidth=400){usingvarsteam=newMemoryStream(imageBytes);using(varimage=......