首页 > 其他分享 >实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!

时间:2024-09-04 11:25:43浏览次数:5  
标签:TurboEdit Adobe 反演 提示 图像编辑 编辑 图像 x0 文本


实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_计算机视觉

今天给大家介绍Adobe研究院新的研究TurboEdit,可以通过文本来编辑图像,通过一句话就能改变图像中的头发颜色、衣服、帽子、围巾等等。而且编辑飞快,<0.5秒。简直是图像编辑的利器。

相关链接

项目:betterze.github.io/TurboEdit

论文:arxiv.org/abs/2408.08332

论文阅读

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_人工智能_02

TurboEdit: Instant text-based image editing(即时基于文本的图像编辑)

摘要

我们在几步扩散模型的背景下解决了精确图像反转和分离图像编辑的挑战。

我们引入了一种基于编码器的迭代反演技术。反演网络以输入图像和上一步的重建图像为条件,允许对输入图像进行下一次重建校正。我们证明,通过以(自动生成的)详细文本提示为条件,可以在几步扩散模型中轻松实现分离控制。

为了操纵反转图像,我们冻结噪声图并修改文本提示中的一个属性(手动或通过 LLM 驱动的基于指令的编辑),从而生成与输入图像相似的新图像,但只有一个属性发生变化。它可以进一步控制编辑强度并接受指导性文本提示。

我们的方法促进了实时的真实文本引导图像编辑,反转中只需要 8 个功能评估 (NFE)(一次性成本),每次编辑只需要 4 个 NFE。我们的方法不仅速度快,而且明显优于最先进的多步扩散编辑技术。

方法

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_stable diffusion_03

给定一个输入的真实图像 x0,我们利用 LLaVA 生成详细的标题 c。用户可以修改 c 以创建新的文本提示 c ′。反演过程首先将 x0、c、当前时间步长 t 和之前重建的图像 x0,t+1(初始化为零矩阵)输入反演网络。然后,该网络预测噪声 ϵt,随后将其输入到冻结的 SDXL-Turbo 模型中以生成新的重建图像 x0,t。给定最终的反演噪声 ϵt 以及 c,我们可以使用 SDXL-Turbo 创建反演轨迹并重建 x0,0,这与 x0 非常相似。使用相同的噪声 ϵt 和略有不同的文本提示 c ′,从 t = T 开始到更小的 t,编辑轨迹将与反演轨迹非常相似,生成的图像将与输入图像非常相似,仅在 c' 中指定的属性上有所不同。

实验

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_计算机视觉_04

当呈现简洁的源文本提示时,文本空间中的微小编辑可能导致图像空间中的布局和结构发生重大变化。相反,在详细的文本提示中进行小文本编辑往往会导致图像空间中发生更简单的变化。结果来自使用相同随机种子的单步图像生成。下面提供了标题和颜色编码的修改区域。

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_AIGC_05

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_图像生成_06

给定详细的源文本和相应的目标文本,我们可以对文本嵌入进行插值,并在图像空间中生成平滑的插值,即使对于较大的结构变化也是如此。

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_AIGC_07

使用 PIE-Bench 数据集中的描述性文本进行图像编辑比较。效率是在单个 H100 GPU 中测量的。我们的方法实现了最佳的背景保留和剪辑相似性,同时比其他方法快得多(4 步 DDIM 除外)。

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_人工智能_08

我们比较了使用描述性文本提示作为指导的方法。尽管我们的方法只需要四个步骤,但它的表现优于多步骤方法,特别是在需要对属性进行重大结构变化的场景中,例如添加帽子或将男人变成女人。相比之下,InfEdit 和 Pix2PixZero 在背景和身份保存方面遇到了困难。同样,Ledits 和 Ledits++ 无法有效处理大的结构变化,这一点从它们无法添加高顶礼帽或将男人变成女人就可以看出。

实时图像编辑大革新!Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!_stable diffusion_09

我们评估了利用指导性提示作为指导的方法。虽然我们的方法不需要任何意外训练,只需要四个采样步骤,但在身份保存(猫到狗)和文本提示对齐(毛衣到 T 恤)方面,它优于 InstructPix2Pix 及其变体。值得一提的是,InstructPix2pIx 及其变体需要收集大规模意外训练集、计算密集型训练和多步骤采样。

结论

据我们所知,我们的方法是第一个在几步扩散模型的背景下探索图像编辑的工作,也是第一个探索扩散模型中基于编码器的反演的工作。我们证明,通过对(自动生成的)详细文本提示进行条件处理,可以在几步扩散模型中轻松实现解缠结控制。我们的方法使用户能够以交互速率进行逼真的文本引导图像编辑,反演和编辑过程都在几毫秒内完成。

标签:TurboEdit,Adobe,反演,提示,图像编辑,编辑,图像,x0,文本
From: https://blog.51cto.com/u_16658015/11917068

相关文章

  • vue3整合antv x6实现图编辑器快速入门
    安装:npminstall@antv/x6--save如果使用umd包,可以使用下面三个CDN中的任何一个,默认使用X6的最新版:https://unpkg.com/@antv/x6/dist/index.jshttps://cdn.jsdelivr.net/npm/@antv/x6/dist/index.jshttps://cdnjs.cloudflare.com/ajax/libs/antv-x6/2.0.0/index.......
  • Adobe Illustrator (AI)2024完整版WIN/MAC中文软件免费下载安装和快捷键的使用
    目录一、软件概述1.1定义与用途1.2矢量与位图的区别1.3主要功能特点二、安装步骤2.1准备工作2.2安装过程2.3安装后设置三、常用快捷键3.1文件与视图3.2选择与编辑3.3绘图与变换一、软件概述1.1定义与用途AdobeAI是一款由AdobeSystems开发的专业......
  • 探索 Adobe Acrobat Reader 的高级功能
    AdobeAcrobatReader是一款流行的PDF阅读器,不仅仅用于查看PDF文件,它还提供了许多强大的高级功能,能够帮助用户更高效地处理文档。本文将详细介绍AdobeAcrobatReader的高级功能,并通过实际操作案例来增强阅读体验。1.AdobeAcrobatReader简介AdobeAcrobatReader......
  • Fabric.js全面介绍:强大的交互式图形编辑框架
    在前端开发中,图形界面的创建与编辑一直是开发者们关注的重点。随着Web技术的不断发展,HTML5Canvas提供了一个强大的画布功能,然而其API相对低级,操作复杂图形和高级交互时显得力不从心。这时,Fabric.js应运而生,它是一款基于HTML5Canvas的JavaScript库,为开发者们提供了一个简......
  • 【甲方安全建设】富文本编辑器XSS漏洞攻击及防御详析
    原创文章,禁止转载。目录调研背景搭建TinyMCE富文本编辑器靶场富文本编辑器前端过滤富文本编辑器后端攻击后端弱过滤弱过滤1弱过滤2后端有效过滤从甲方的视角看动态安全调研背景随着Web2.0技术的普及,富文本编辑器在各种Web应用中得到了广泛应用,用户、网站管理员等可以通过富......
  • 【树莓派开发】树莓派安装vim编辑器(附带排错流程)
    文章目录前言1.用putty软件链接树莓派2.下载vim2.1错误:404无法下载2.2错误:下列软件包有未满足的依赖关系3.查看vim是否安装成功4.vim的基本操作5.用vim编写一个C语言代码结语前言Linux自带的编辑器有nano和vi,但vi编辑器使用起来很不方便。我们要先在树莓派上下载vim编辑器,它是vi......
  • 最短编辑距离
    给定两个字符串 AA 和 BB,现在要将 AA 经过若干操作变为 BB,可进行的操作有:删除–将字符串 AA 中的某个字符删除。插入–在字符串 AA 的某个位置插入某个字符。替换–将字符串 AA 中的某个字符替换为另一个字符。现在请你求出,将 AA 变为 BB 至少需要进行多少次......
  • Affinity Photo 2.5.3.2516 x64 (照片编辑) 授权版
    AffinityPhoto是全球数百万创意和摄影专业人士的首选。这款备受赞誉的图像编辑软件拥有令人难以置信的速度、功能和精度,可以满足您编辑和修饰照片、创建多图层构图、精美的栅格绘图等一切需要。该版本已授权,可以免费使用。软件截图:使用说明:1、将压缩文件解压到某固定位......
  • 2024 年 13 个适用于 Linux 的最佳照片图像编辑器
      2024年13个适用于Linux的最佳照片图像编辑器   在本文中,我回顾了各种Linux发行版上可用的一些最佳照片编辑软件。这些不是唯一可用的照片编辑器,但却是Linux用户最流行和最常用的照片编辑器之一。1.GIMP首先,在列表中,我们有 GIMP,一个免费、开源、跨平台......
  • Adobe Premiere Pro 2023 激活版下载安装教程
    前言AdobePremierePro(简称PR)是一款知名的专业视频编辑软件,数字视频剪辑软件。主要用来编辑视频和音频,可以在RGB和YUV色彩空间中以高达32位色彩的视频分辨率对4K和更高质量的视频文件进行编辑,支持VST音频插件和音轨5.1环绕声,支持沉浸式360/VR视频,基于非线性编辑的软件。Premiere......