[论文阅读] BBDM@ Image-to-Image Translation With Brownian Bridge Diffusion Models

时间：2024-06-18 16:55:30浏览次数：25

标签：Diffusion Bridge Image Brownian BBDM 图像

Pre

title: BBDM: Image-to-Image Translation With Brownian Bridge Diffusion Models
source: CVPR 2023
paper: https://arxiv.org/abs/2205.07680
code: https://github.com/xuekt98/BBDM

关键词: I2I, Brownian Bridge, Diffusion
阅读理由: 挺新奇的

Motivation

GAN-based 方法在训练时难以稳定，且输出经常出现模式崩溃
扩散模型虽然表现出色，但它们通常将图像翻译视为条件生成过程，将参考图像用作条件引导向目标域的扩散，泛化性较差，在不同域之间存在较大的差距时会导致性能下降

Idea

将图像翻译建模为随机布朗桥过程，通过双向扩散过程直接学习两个域之间的转换

Background

图1 BBDM (Brownian Bridge Diffusion Model) 和 DDPM (Denoising Diffusion Probabilistic Model) 有向图模型的比较

重点在于过程的两个端点和条件y的使用

布朗桥：两个端点确定，中间的随机过程形成桥。方差可以提供必要的随机性，以学习复杂的数据分布并生成多样化的图像翻译结果，通过调整最大方差值还能平衡样本的质量和多样性。

Method（Model）

Overview

图2 BBDM的架构

编解码器是预训练的VQGAN，下方灰色的是布朗桥过程，z_t以z_0,z_T为条件得到

训练

目标是优化证据下界（Evidence Lower Bound，ELBO），同样是最小化预测噪声和实际噪声之间的差异：

加速采样

为了提高采样效率，BBDM采用了类似DDIM的方法，选择一系列时间步长\(\tau_1, \tau_2, ..., \tau_S\)子序列来做推理时的采样，相当于跳步

Experiment

图3 CelebAMask-HQ数据集上的比较

图4 不同图像翻译任务上的比较

图5 DDBM在不同图像翻译任务上的多样生成

表1 CelebAMask-HQ数据集上的定量比较

表2 DDBM在不同图像翻译任务上的定量比较

图6 其他图像翻译任务

图7 隐空间可视化

表3 不同下采样倍数的比较

Critique

很新奇，感觉跟之前看过的Rectified Flow有点神似，都是看着效果好但没有推广开来

标签：Diffusion,Bridge,Image,Brownian,BBDM,图像
From： https://www.cnblogs.com/Stareven233/p/18254684

AI绘画-Stable Diffusion三次元人物模型训练（炼丹）教程，你也可以定制你的三上youya老师！
大家好，我是设计师阿威（Stablediffusion生成的三上youya老师）用AI进行画出不同人物，我们需要训练自己Lora模型。除了训练二次元人物之外，也常常要训练三次元人物。比如福利姬老师可以训练自己然后穿上各种美美的衣服来拍照，减少自己的日常工作量。我们也可以训练模特人物之......
AI绘画Stable Diffusion 挽救渣图的神器—Loopback Scaler脚本，你值得拥有！
大家好，我是向阳今天这篇文章就是围绕着开局的这两张原图开始的。在Stablediffusion甚至当前所有的AI画图工具里面，AI生成内容随机性都是一个很大的问题。我们经常遇到一张图构图不错但是脸崩了，又或者人物形象不错但是背景画得崩了这样的问题。前者我们往往把图扔到图生......
【Stable Diffusion教程】AI绘画工具SD如何安装使用？三种方法带你轻松上手！（附安装包和云
大家好，我是向阳AI绘画专业工具StableDiffusion在哪里用怎么安装？这一期给大家介绍三种使用SD的方法，无论你有没有专业显卡都能轻松上手SD哦～一、SD本地部署秋葉安装包安装方法如果你有进一步的需求，想要学习SD的高端玩法，有高端显卡的同学们我建议本地安装部署一下SD。这里要......
stable-diffusion-3-medium 大模型下载地址
由于huggingface.co下载速度不佳，放在夸克网盘上了：https://pan.quark.cn/s/6ab1885c2e51 有条件的可以从huggingface下载：https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main StableDiffusion3Medium是基于OpenAI的扩散模型理论基础之上发展的......
欢迎 Stable Diffusion 3 加入 Diffusers
作为StabilityAI的StableDiffusion家族最新的模型，StableDiffusion3(SD3)现已登陆HuggingFaceHub，并且可用在......
No connection adapters were found for 'data:image/png;base64
Noconnectionadapterswerefoundfor'data:image/png;base64,...' 这个错误通常发生在尝试使用像requests这样的HTTP库去访问一个DataURIscheme时。DataURIscheme（如data:image/png;base64,...）不是一个有效的URL，而是一个嵌入在文档或网页中的二进制数据的直接表示，通常用于......
html2canvas插件线上image转base64
UncaughtDOMException:Failedtoexecute'toDataURL'on'HTMLCanvasElement':Taintedcanvasesmaynotbeexported.html2canvas，如果html中有image，需要转base64才能正常转换image。本地调试可能存在跨域访问图片问题。由于图片服务器未开启跨域允许权限。Access-Control-A......
Midjourney和stable diffusion到底有什么区别？要怎么选？
前言目前AIGC领域里最强的两款软件，Midjourney（MJ）和stablediffusion（SD）到底有什么区别？我们应该怎么选择呢？这是很多新手朋友经常问的问题，这篇文章对此问题专门进行解释说明。视频版在aigc界的地位MJ和SD在aigc界都算是“顶流”的存在。基本上没有能与之抗衡的其他主流产品......
这份 Stable diffusion 提示词攻略，记得收好了！
大家好，今天给大家分享的是关于Stablediffusion提示词的基础和进阶语法，为什么有必要了解这个呢？首先是提示词对出图效果影响很大，了解提示词的用法有助于我们写出更优秀的提示词；其次就是我们可能会去C站拷贝别人的提示词，虽然直接拷贝过来也能得到不错的效果，但这样只会“知其......
WPF press keydown and show image one by one
//xaml<Windowx:Class="WpfApp175.MainWindow"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d="http://schemas.mi......