首页 > 其他分享 >[论文阅读] BBDM@ Image-to-Image Translation With Brownian Bridge Diffusion Models

[论文阅读] BBDM@ Image-to-Image Translation With Brownian Bridge Diffusion Models

时间:2024-06-18 16:55:30浏览次数:24  
标签:Diffusion Bridge Image Brownian BBDM 图像

Pre

title: BBDM: Image-to-Image Translation With Brownian Bridge Diffusion Models
source: CVPR 2023
paper: https://arxiv.org/abs/2205.07680
code: https://github.com/xuekt98/BBDM

关键词: I2I, Brownian Bridge, Diffusion
阅读理由: 挺新奇的

Motivation

  1. GAN-based 方法在训练时难以稳定,且输出经常出现模式崩溃
  2. 扩散模型虽然表现出色,但它们通常将图像翻译视为条件生成过程,将参考图像用作条件引导向目标域的扩散,泛化性较差,在不同域之间存在较大的差距时会导致性能下降

Idea

将图像翻译建模为随机布朗桥过程,通过双向扩散过程直接学习两个域之间的转换

Background

图1 BBDM (Brownian Bridge Diffusion Model) 和 DDPM (Denoising Diffusion Probabilistic Model) 有向图模型的比较

重点在于过程的两个端点和条件y的使用

布朗桥:两个端点确定,中间的随机过程形成桥。方差可以提供必要的随机性,以学习复杂的数据分布并生成多样化的图像翻译结果,通过调整最大方差值还能平衡样本的质量和多样性。

Method(Model)

Overview

图2 BBDM的架构

编解码器是预训练的VQGAN,下方灰色的是布朗桥过程,z_t以z_0,z_T为条件得到

训练

目标是优化证据下界(Evidence Lower Bound,ELBO),同样是最小化预测噪声和实际噪声之间的差异:

加速采样

为了提高采样效率,BBDM采用了类似DDIM的方法,选择一系列时间步长\(\tau_1, \tau_2, ..., \tau_S\)子序列来做推理时的采样,相当于跳步

Experiment

图3 CelebAMask-HQ数据集上的比较

图4 不同图像翻译任务上的比较

图5 DDBM在不同图像翻译任务上的多样生成

表1 CelebAMask-HQ数据集上的定量比较

表2 DDBM在不同图像翻译任务上的定量比较

图6 其他图像翻译任务

图7 隐空间可视化

表3 不同下采样倍数的比较

Critique

很新奇,感觉跟之前看过的Rectified Flow有点神似,都是看着效果好但没有推广开来

标签:Diffusion,Bridge,Image,Brownian,BBDM,图像
From: https://www.cnblogs.com/Stareven233/p/18254684

相关文章

  • AI绘画-Stable Diffusion三次元人物模型训练(炼丹)教程,你也可以定制你的三上youya老师!
    大家好,我是设计师阿威(Stablediffusion生成的三上youya老师)用AI进行画出不同人物,我们需要训练自己Lora模型。除了训练二次元人物之外,也常常要训练三次元人物。比如福利姬老师可以训练自己然后穿上各种美美的衣服来拍照,减少自己的日常工作量。我们也可以训练模特人物之......
  • AI绘画Stable Diffusion 挽救渣图的神器—Loopback Scaler脚本,你值得拥有!
    大家好,我是向阳今天这篇文章就是围绕着开局的这两张原图开始的。在Stablediffusion甚至当前所有的AI画图工具里面,AI生成内容随机性都是一个很大的问题。我们经常遇到一张图构图不错但是脸崩了,又或者人物形象不错但是背景画得崩了这样的问题。前者我们往往把图扔到图生......
  • 【Stable Diffusion教程】AI绘画工具SD如何安装使用?三种方法带你轻松上手!(附安装包和云
    大家好,我是向阳AI绘画专业工具StableDiffusion在哪里用怎么安装?这一期给大家介绍三种使用SD的方法,无论你有没有专业显卡都能轻松上手SD哦~一、SD本地部署秋葉安装包安装方法如果你有进一步的需求,想要学习SD的高端玩法,有高端显卡的同学们我建议本地安装部署一下SD。这里要......
  • stable-diffusion-3-medium 大模型下载地址
    由于huggingface.co下载速度不佳,放在夸克网盘上了:https://pan.quark.cn/s/6ab1885c2e51 有条件的可以从huggingface下载:https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main StableDiffusion3Medium是基于OpenAI的扩散模型理论基础之上发展的......
  • 欢迎 Stable Diffusion 3 加入 Diffusers
    作为StabilityAI的StableDiffusion家族最新的模型,StableDiffusion3(SD3)现已登陆HuggingFaceHub,并且可用在......
  • No connection adapters were found for 'data:image/png;base64
    Noconnectionadapterswerefoundfor'data:image/png;base64,...' 这个错误通常发生在尝试使用像requests这样的HTTP库去访问一个DataURIscheme时。DataURIscheme(如data:image/png;base64,...)不是一个有效的URL,而是一个嵌入在文档或网页中的二进制数据的直接表示,通常用于......
  • html2canvas插件 线上image转base64
    UncaughtDOMException:Failedtoexecute'toDataURL'on'HTMLCanvasElement':Taintedcanvasesmaynotbeexported.html2canvas,如果html中有image,需要转base64才能正常转换image。本地调试可能存在跨域访问图片问题。由于图片服务器未开启跨域允许权限。Access-Control-A......
  • Midjourney和stable diffusion到底有什么区别?要怎么选?
    前言目前AIGC领域里最强的两款软件,Midjourney(MJ)和stablediffusion(SD)到底有什么区别?我们应该怎么选择呢?这是很多新手朋友经常问的问题,这篇文章对此问题专门进行解释说明。视频版在aigc界的地位MJ和SD在aigc界都算是“顶流”的存在。基本上没有能与之抗衡的其他主流产品......
  • 这份 Stable diffusion 提示词攻略,记得收好了!
    大家好,今天给大家分享的是关于Stablediffusion提示词的基础和进阶语法,为什么有必要了解这个呢?首先是提示词对出图效果影响很大,了解提示词的用法有助于我们写出更优秀的提示词;其次就是我们可能会去C站拷贝别人的提示词,虽然直接拷贝过来也能得到不错的效果,但这样只会“知其......
  • WPF press keydown and show image one by one
    //xaml<Windowx:Class="WpfApp175.MainWindow"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d="http://schemas.mi......