首页 > 其他分享 >NOISEDIFFUSION: 改进基于扩散模型的球面线性插值

NOISEDIFFUSION: 改进基于扩散模型的球面线性插值

时间:2024-05-02 16:11:25浏览次数:24  
标签:NOISEDIFFUSION 阈值 插值 噪声 线性插值 球面 图像 方法

Motivation :
1.改进自然图像的插值质量:现有的图像插值方法,尤其是那些基于扩散模型的方法,通常在处理非模型生成的自然图像时遇到困难。这些方法往往不能有效地处理自然图像中的复杂和多样的噪声分布,导致插值结果不自然或有明显的图像伪影。
2.处理编码噪声的无效性:在图像插值过程中,图像首先被编码到一个噪声空间,然后通过去噪技术恢复。然而,如果编码的噪声不符合预期的噪声分布(例如正态分布),这个基础假设的破坏会导致插值过程中的问题,比如图像质量下降或者细节丢失。
3.提高信噪比和减少信息损失:传统方法在引入噪声以匹配预期分布的过程中,可能会降低图像的信噪比,从而损失重要的图像信息。NoiseDiffusion方法通过在噪声图像空间进行插值,并将原始图像数据注入到噪声图像中,旨在解决这一信息损失问题。

在DDIM中 其实还有两个小点 :重建与插值 不过 DDIM中的插值是对由扩散模型生成之后的图像做的插值 然而,当将其扩展到自然图像时,插值结果的质量可能未达到预期,并且经常引入伪影 也就是论文中的Figure1的中间的生成效果

作者认为 产生不优的结果的原因是编码噪声不遵守预期的正态分布并可能包含高于或低于去噪阈值的噪声成分,导致最终插值图像中出现伪影。

根据图3中展示的结果,我们观察到,添加与去噪水平匹配的高斯噪声可以产生高质量的图像。然而,当噪声水平超过去噪阈值时,生成的图像中会引入额外的伪影。相反,当噪声水平低于去噪阈值时,结果图像看起来有些模糊,伴随着明显的特征丢失。

随后作者提出了定理1 并基于定理一 将球面线性图像插值的失败归咎于噪声水平和去噪阈值之间的不匹配。自然图像包含了模型之前未曾遇到的许多特征。因此,潜在变量不遵循预期的正态分布,并可能包含高于或低于去噪阈值的噪声成分,导致去噪后图像质量低下。

一种直观的方式是直接向图像中添加与预定去噪阈值匹配的高斯噪声。这样做可以确保图像的噪声水平适合模型的处理能力,从而在去噪时保持图像质量。

4.3介绍了一种结合了SDEdit的图像插值方法。当给定两幅图像时,该方法首先在同一水平上为它们每一幅添加高斯噪声。接下来,我们使用球面线性插值,并随后进行去噪处理。

但是由于这种图像插值方法基于SDEdit,它不可避免地继承了SDEdit方法的缺点,如图4所示。

图4中呈现的插值结果表明,该方法可以处理图像质量差的问题。然而,当我们添加更多高斯噪声并去噪时,插值的图像在保持原始风格的同时,表现出类似于直接图像叠加的现象。相反,选择较少的高斯噪声并去噪,虽然确保了图像的真实性,但引入了额外信息,最终导致插值失败。

所以 作者提出了noise diffusion :给定两幅图像,我们首先通过将它们编码到潜在空间并剪切以抑制极端值的噪声来开始,然后我们将潜在变量与高斯噪声结合,并且结合这些与原始图像,最后应用剪切和去噪来产生插值结果

剪切的方法则是使用了68-95-99.7规则
如果像素值大于边界值,则设为边界值。
如果像素值小于负边界值,则设为负边界值。
否则,保持像素值不变。

随后作者证明了球面线性插值和引入噪音的线性插值其实是noisediffusion的一种特殊情况

最后实验部分介绍了几种参数的影响 以及在什么时候做边界控制

总的来说 提出了一种新的方法 该方法克服了球面线性插值的局限性。该方法建立了一个统一框架,结合了球面线性插值和直接引入噪声用于插值的方法的优点。此外,通过对噪声施加边界控制并补充原始图像信息,有效地应对了噪声水平超出或低于去噪阈值所带来的挑战。通过对潜在变量的修正,实现了更优的插值效果。

标签:NOISEDIFFUSION,阈值,插值,噪声,线性插值,球面,图像,方法
From: https://www.cnblogs.com/zhaihaotian/p/18170244

相关文章

  • 图像缩放算法双线性插值法
    双线性插值法是一种常用的图像缩放算法,它可以通过对原始图像中的像素进行加权平均来计算目标图像中的像素值。相比最近邻插值,双线性插值可以更准确地估计像素之间的灰度值。具体实现步骤如下:计算目标图像与原始图像的尺寸比例关系,即缩放因子。缩放因子可以根据目标图像的宽......
  • 线性插值计算百分位数的C++示例
    代码如下#include<iostream>#include<vector>#include<algorithm>doublepercentile_linear_interpolation(conststd::vector<double>&data,doublepercentile){//确保百分位数在合理范围内if(percentile<0.0||percentile>1......
  • qt c语言双三次线性插值
    用chatgpt生成的测试了比较卡for(inty=0;y<enlargedHeight;y++){for(intx=0;x<enlargedWidth;x++){//计算原始图像中对应的浮点坐标floatoriginalX=(float)x/(float)enlar......
  • OpenLayers6使用天地图&ldquo;经纬度投影(CGCS2000)&rdquo;和&ldquo;球面墨卡托投影(E
    转自:https://blog.csdn.net/nudtcadet/article/details/1029084581.封装生成图层类/***@fileOverview天地图WMTS服务API*@author<ahref=”https://blog.csdn.net/nudtcadet”>老胡</a>*@version1.0*/import{getWidth,getTopLeft}from'ol/extent';impo......
  • 线性插值
    线性插值publicstaticvoidinterpolate(List<Double>list){intstart=-1;for(inti=0;i<list.size();i++){if(list.get(i)==null)continue;if(start!=-1){intcount=i-sta......
  • ArcMap栅格重采样:最邻近分配、众数算法、双线性插值、三次卷积插值
      本文介绍在ArcMap软件中,实现栅格图像重采样的具体操作,以及不同重采样方法的选择依据。  在文章ArcPy批量掩膜、重采样大量遥感影像中,我们介绍了基于Python中Arcpy模块对栅格图像加以批量重采样的方法;而在ArcMap软件中,我们可以实现不需要代码的栅格重采样操作;本文就对这一操......
  • 椭球面拟合方法及一般多项式函数拟合拓展
    基于对一般二次曲面拟合效果的不满,特地整理这一篇文章。不加任何限制的一般二次曲面拟合在机器视觉实际应用时会出现很多意外的情况。比如文章《匹配位姿拟合求精方法-兜尼完-博客园(cnblogs.com)》和《9点拟合梯度边缘亚像素方法-兜尼完-博客园(cnblogs.com)》,这两种方......
  • 双线性插值
    本文摘自:(三十六)通俗易懂理解——ROIAlign的基本原理及rpn与rcnnhead锚框标签制作-知乎(zhihu.com) ......
  • @血源萌新☜ 怎么推导 黎曼几何 球面短程线 ?
    怎么推导黎曼几何球面短程线,  我问过   @血源萌新☜  两次, 一次是在反相吧, 一次是在高级民科吧,  见  反相吧 《【水】老杨终于露出了维相真面目》     https://tieba.baidu.com/p/8297248311   15楼, 高级民科吧   《4维度正方......
  • 三线性插值(三维线性插值)过程
    *:一维线性插值、二线性插值(二维线性插值),可以参考我的这篇博客,有详细的讲解:线性插值,双线性插值讲解_二维线性插值_仰望星空-自然-7的博客-CSDN博客 在数学上,三维线性插值是有三个自变量的插值函数的线性插值扩展,其核心思想是在三个方向(即:x方向,y方向,z方向)分别进行线性插......