Image Processing and Analysis_8_Edge Detection

标签：检测 Image Processing 方法 Detection 边缘图像轮廓 IEEE

此主要讨论图像处理与分析。虽然计算机视觉部分的有些内容比如特征提取等也可以归结到图像分析中来，但鉴于它们与计算机视觉的紧密联系，以及它们的出处，没有把它们纳入到图像处理与分析中来。同样，这里面也有一些也可以划归到计算机视觉中去。这都不重要，只要知道有这么个方法，能为自己所用，或者从中得到灵感，这就够了。

8. Edge Detection
边缘检测也是图像处理中的一个基本任务。传统的边缘检测方法有基于梯度算子，尤其是 Sobel 算子，以及经典的 Canny 边缘检测。到现在，Canny 边缘检测及其思想仍在广泛使用。关于 Canny 算法的具体细节可以在 Sonka 的书以及 canny 自己的论文中找到，网上也可以搜到。最快最直接的方法就是看 OpenCV 的源代码，非常好懂。在边缘检测方面，Berkeley 的大牛 J Malik 和他的学生在 2004 年的 PAMI 提出的方法效果非常好，当然也比较复杂。在复杂度要求不高的情况下，还是值得一试的。MIT的Bill Freeman早期的代表作Steerable Filter 在边缘检测方面效果也非常好，并且便于实现。这里给出了几篇比较好的文献，包括一篇最新的综述。边缘检测是图像处理和计算机视觉中任何方向都无法逃避的一个问题，这方面研究多深都不为过。
[1980] theory of edge detection
[1983 Canny Thesis] find edge
[1986 PAMI] A Computational Approach to Edge Detection
[1990 PAMI] Scale-space and edge detection using anisotropic diffusion
[1991 PAMI] The design and use of steerable filters
[1995 PR] Multiresolution edge detection techniques
[1996 TIP] Optimal edge detection in two-dimensional images
[1998 PAMI] Local Scale Control for Edge Detection and Blur Estimation
[2003 PAMI] Statistical edge detection_ learning and evaluating edge cues
[2004 IEEE] Edge Detection Revisited
[2004 PAMI] Design of steerable filters for feature detection using canny-like criteria
[2004 PAMI] Learning to Detect Natural Image Boundaries Using Local Brightness, Color, and Texture Cues
[2011 IVC] Edge and line oriented contour detection State of the art

翻译

面向边缘和线条的轮廓检测：最新技术——http://tongtianta.site/paper/56281

作者：Giuseppe Papari *, Nicolai Petkov

摘要 -我们概述了过去二十年来提出的各种针对轮廓的边缘和线条定向方法。面向边缘和线的意思是不依赖于分割的方法。在边缘和轮廓之间进行区分。轮廓检测器分为本地和全局运算符。前者主要基于差异分析，统计方法，相位一致，等级排序过滤器及其组合。后者包括轮廓显着性的计算，感知分组，松弛标记和活动轮廓。涵盖了重要方面，例如旨在抑制纹理和噪声的预处理，多分辨率技术，计算模型与人类视觉系统的属性之间的联系，以及用于定量性能评估的过程和度量的使用。我们的主要结论是，考虑到多峰轮廓定义(通过亮度，颜色或纹理变化)，减少噪声和纹理的轮廓掩盖影响的机制，感知分组，多尺度方面和高水平，轮廓检测已达到高度复杂性水平视觉信息。

关键词：轮廓检测，预处理，局部模式分析，轮廓显着性，格式塔分组，闭合，比例空间，性能评估

1.简介
2.预处理
2.1.本地自适应过滤
2.2.功能最小化和非线性扩散
2.3.讨论
3.局部模式分析
3.1.差分运算符
3.2.统计方法
3.3.相一致和局部能量
3.4.VOS和形态学边缘检测器
3.5.结合当地特色
3.6.讨论
4.上下文和全局方法
4.1.轮廓突出
4.2.根据格式塔原理将像素分组为轮廓.
4.3.活动轮廓
4.4.讨论
5.多分辨率方法
5.1.多分辨率分析
5.2.比例尺空间中的轮廓检测
6.绩效评估
6.1.一般方法
6.2.性能指标
7.1.线性局部方法的复杂性
7.2.非线性局部方法的复杂性
7.3.非本地方法的复杂性
8.总结，讨论和结论
8.1.取决于输入参数
8.2.计算步骤的相互依存
8.3.形状信息的重要性

1.简介

对象轮廓在人类视觉中起着重要作用。例如，临床证据表明，负责感知轮廓的大脑区域V1和V2受损，使患者完全无法识别物体[1]。图1显示了一个区域边界(通常是区域边界与对象轮廓重合)如何影响人类视觉感知的示例。在图像的两端，平均亮度是相同的。但是，由于中间的亮度不连续，图像的左部分显得比右部分更亮。这表明这种不连续性的存在不仅影响边界的直接邻域，而且还影响整个图像的感知。另一个示例如图2所示。两个对象图标在其95％的像素中相同，但是轮廓上的细微差异导致感知到两个对象在语义上完全不同。建立用于轮廓感知的计算模型的重要性超出了人类视觉系统的唯一理解。在计算机视觉的许多实际应用中，例如对象识别，机器人视觉或医学图像分析，都需要轮廓检测算法。

Image Processing and Analysis_8_Edge Detection_边缘检测

图1：人眼中边界的重要性：左图是通过在右图所示的1D亮度轮廓上添加合成纹理获得的。

Image Processing and Analysis_8_Edge Detection_边缘检测_02

图2.轮廓在形状识别中的重要性：尽管所示的心脏和苹果图标重叠了超过95％的像素，但由于轮廓不同，我们很容易将它们识别为不同的形状。

与计算机视觉中使用的其他概念类似，例如，他们不了解关于人脸识别的任何论文，其中给出了人脸概念的定义。几位作者倾向于将轮廓视为图像中有趣区域的边界。但是，这样的定义将排除轮廓不是由区域边界引起的重要情况。图3中给出了两个示例。对于左侧的合成示例，图像中的每条线都应视为轮廓，尽管这些线都不是不同颜色或纹理的两个区域之间的边界。换句话说，在此示例中，轮廓图与图像本身重合。在中间，我们有一个自然图像，并在此图像上有一个手工绘制的相关等高线图，均取自伯克利数据集[2]。如我们所见，同样在这种情况下，并非所有轮廓都来自区域边界，例如船的绳索。在图4中给出了另一个示例，其描绘了观察轮廓的四种不同方式。在前两幅图像中，轮廓由亮度和纹理的局部变化定义，而在第三种和第四种情况下，全局关系引起对轮廓的感知。如我们所见，仅在前两种情况下，轮廓是由区域边界产生的。我们宁愿假设需要在给定图像中绘制轮廓的人类观察者之间会有很大的集中度。在[2]中提出的定量分析显示了这种一致性有多强，表明轮廓的概念被不同的观察者用来指代相同的特征。

Image Processing and Analysis_8_Edge Detection_轮廓检测_03

图3：不是由区域边界产生的轮廓示例：(左)合成图像，其中轮廓图与图像重合；(中)来自伯克利数据集[2]的自然图像；(右) 相关的等高线图，它说明了等高线的概念比区域边界的概念更广泛(例如，参见船的绳索)。

Image Processing and Analysis_8_Edge Detection_区域边界_04

图4：轮廓被感知的各种环境从左到右：轮廓由亮度和纹理变化，感知分组或附近点以及虚轮廓线定义。

由于人类的判断是唯一可以用来判断给定视觉特征是否为轮廓的标准，因此我们在操作上将给定图像中的轮廓定义为人类观察者将集中的线集合作为轮廓在该图像中(可以对图像处理和视觉模式识别文献中使用的其他概念(例如人脸)进行类似的操作定义)。有鉴于此，轮廓检测的研究旨在以数学方式理解和建模人们(有意识地或有意识地)用来识别这些线集的特征(例如对比度，良好的连续性和闭合性)。

在本文中，我们提出了一种基于上述轮廓的运算定义的现有轮廓检测器算法的分类法。具体来说，我们根据每种方法中使用的感知上重要的特征对轮廓检测算法进行分类。这导致两类算法：(i)局部方法，其中定义的特征是亮度，颜色和纹理的局部差异；(ii)全局方法，其中基于良好的连续性和闭合性来识别轮廓。

由于各种实际原因，例如可能的低信噪比(SNR)或输入图像中存在纹理，轮廓检测是一项艰巨的任务。图5显示了一些图像示例，这些图像的轮廓无法通过简单的低级视觉模型检测到，并且还需要高级视觉提示(例如形状)的反馈。这意味着必须通过引入有关要检测轮廓的先验知识(例如形状)来解释输入图像。但是，这种低水平和高水平视觉提示的集成被证明是一项艰巨的任务，通常会导致非常复杂的模型和对计算要求很高的算法，这些算法仅在特殊情况下才有效。

Image Processing and Analysis_8_Edge Detection_轮廓检测_05

图5：考虑到全球感知组织和对世界的了解，轮廓检测需要高水平视觉的解释和反馈的图像示例。

我们区分以下几类轮廓检测器：(i)面向区域的方法[3,4]，其中首先确定纹理或颜色恒定或缓慢变化的区域；然后将轮廓直接确定为封闭区域边界； (ii)面向边缘和线条的方法[5]，其中检测由亮度，颜色或纹理的对比度定义的线条或边界； (iii)混合方法[6]，其目的是区域和区域边界之间的一致性。在这里，我们对类(ii)的方法感兴趣。此类包括各种各样的技术，并且已针对每种特定方法类发布了概述文章。例如图像的微分结构分析[7](1994)，尺度空间理论[8,9](2001，2003)，统计分析，感知组织[10,11](1993，1999)和可变形模型，例如作为活动轮廓[12](1996)。 [6](1998)提出了边缘检测技术的一般概述。它主要侧重于局部方法，而上下文和全局技术(例如根据格式塔定律的边缘分组或活动轮廓)则没有深入讨论。旨在减少输入图像中的纹理和噪声以及进行定量性能评估的预处理也是尚未引起足够重视的问题。

我们承认有关基于区域的轮廓检测(即图像分割)方面的一些工作，在本次调查中不会对其进行深入处理。具体来说，最重要的技术是基于图论和割线[13,14]，迭代均值偏移[15]，统计方法[16,17]，分水岭[18,19]和多通道分析[20,21]。

在本文中，我们概述了轮廓检测的主要面向边缘和直线的方法，这些方法已在上述先前的调查报告中提出。在第二部分中，我们讨论了旨在改善轮廓检测结果的预处理技术。我们将在第3节中讨论基于差分和统计分析，相位一致性和形态梯度的局部边缘检测器。在第4节中，我们考虑上下文和全局轮廓检测器，它们基于轮廓显着性，边缘分组和活动轮廓的计算。由于本地和全局技术的输出都取决于分析图像的分辨率，因此我们也回顾了多分辨率轮廓检测器(第5节)。最后，我们在第6节中描述量化绩效评估程序，并在第8节中得出结论。

2.预处理

本节介绍了旨在简化连续轮廓检测的轮廓保持平滑器(图6)。与图像恢复算法不同，轮廓保留平滑器不仅要消除噪声，还要消除纹理，因为后者会干扰轮廓检测[22]。在第2.1节中讨论了局部轮廓保持平滑器，而在第2.2节中，我们考虑了基于变分方法和非线性扩散的全局轮廓保持平滑器。

Image Processing and Analysis_8_Edge Detection_区域边界_06

图6.轮廓检测预处理的好处。第一行，从左到右：对于相同的σ值，输入图像，线性高斯滤波的输出和[23]中提出的轮廓保持平滑器的输出。第二行，Canny边缘检测器的输出，与三个图像的输入参数值相同。

2.1.本地自适应过滤

减少纹理和噪声的最著名技术是线性低通滤波。但是，由于边缘和拐角主要具有高频分量，因此这些功能也会衰减。为了克服这个问题，已经设计了几种局部非线性轮廓保持平滑器。一个称为自适应平滑的通用框架[24]包括计算局部加权，该局部加权包括计算每个像素r 的邻域N(r) 上灰度级的局部加权平均值，其中权重可以通过多种方式取决于局部模式配置。最著名的自适应平滑技术是双边滤波[25]，均值漂移[15]，值和标准滤波结构[26,27]以及秩次滤波(ROF)，也称为向量阶统计(VOS)[28]。

双边过滤。在双边滤波中，权重由所谓的距离距离d = |I(p)-I(r)|的递减函数给出，权重是通过分析点r 和 ρ∈N(r)上的灰度值之间的局部密度分布得出的。在均值平移中，均值平移的特殊情况[29]。双向滤波和均值向量z = |p,I(p)|^T均可以移动，这表明双向滤波具有良好的性能，尤其是在迭代使用的情况下。然而，双边过滤受到术语 I(p)-I(r) 对噪声非常敏感这一事实的限制[23]。

值和标准过滤器结构。不受此缺点影响的另一种方法是值和标准过滤器结构。具体地，在N(r)的N个可能重叠的子区域上计算输入图像的N个加权局部平均值m和标准偏差s，i ＝ 1 ... N。对于每个像素，运算符的输出由与具有最小s_i的子区域相对应的m_i 值给出。此类运算符的著名代表是Kuwahara和Gauss-Kuwahara滤波器[27]。这种机制可以在保留边缘和角落的同时减少噪声和纹理，并且该框架包括几种作为特殊情况的现有滤镜[30]。此类算子不适当，因为不清楚s_i 的最小值达到一个以上区域时，应选择m_i 的哪个值。在[23]中提出了一个适定的值和准则过滤器结构。

等级排序过滤器。在ROF中，点p_i∈N(r)，i = 1，…，N上的灰度是有序的，局部平均的权重取决于排序中的等级位置。对于灰度图像，最常见的排序标准如下：

•从最暗到最亮的像素；

•根据数量|I(p)-I(r)|，ρ∈N(r)。

在第一种情况下，可以获得几种众所周知的过滤器，例如中值，加权中值，下中上层(LUM)过滤器[31]以及结构膨胀和侵蚀。第二个准则引起k近邻去噪[32]。对于诸如彩色图像之类的矢量值图像，可以制定不同的VOS排序标准[33，34]。在[35]中介绍的最常见的是基于每个像素 ρ_k∈N(r)的总距离dk的计算，其中 l.I 是在有关颜色空间上定义的范数。

Image Processing and Analysis_8_Edge Detection_边缘检测_07

对于异常值较高，而对于所谓的向量中值则最低。通常，ROF和VOS滤波器可以有效降低高斯噪声以及盐和胡椒噪声。

2.2.功能最小化和非线性扩散

一般概念。在本小节中，我们将讨论基于变分方法和偏微分方程的轮廓保持平滑器。我们仅涵盖问题的主要方面，请参考专业文献以进行更详尽的处理(例如，参见[36]及其参考文献)。可以通过搜索在支撑

Image Processing and Analysis_8_Edge Detection_区域边界_08

上定义的函数U(r)来设计全局轮廓保持平滑器，该函数将形式为J = J₁ + 入J₂(其中

Image Processing and Analysis_8_Edge Detection_边缘检测_09

Image Processing and Analysis_8_Edge Detection_轮廓检测_10

)的函数最小化，其中DⁿU是所有部分项的集合U的导数，直到n阶。对于平滑函数U(r)，项J₁低，而J₂是I(r)与U(r)之间的距离(常见选择是

Image Processing and Analysis_8_Edge Detection_区域边界_11

)。系数入控制噪声抑制和数据拟合之间的权衡。 J 的最小值可以看作是观察到的信号 I 在给定功能空间中的投影，其中所有功能都具有某些所需的规律性。例子是函数有界变化的众所周知的空间，Sobolev空间以及最近推出的Meyer空间。我们参考[37]进行简要概述。

Tikohonov正则化。已经详尽地研究了函数

Image Processing and Analysis_8_Edge Detection_区域边界_12

[38，39]，并考虑了关于

Image Processing and Analysis_8_Edge Detection_轮廓检测_13

的数学条件(有关

Image Processing and Analysis_8_Edge Detection_轮廓检测_13

的最常见选择的列表，请参见[39])。重要的情况是

Image Processing and Analysis_8_Edge Detection_边缘检测_15

，称为二阶Tikohonov正则化[40，41]，以及

Image Processing and Analysis_8_Edge Detection_轮廓检测_16

，称为总变异[42]。 Tikohonov正则化也称为线性正则化，因为可以通过线性滤波将相应的函数最小化，但是由于

Image Processing and Analysis_8_Edge Detection_区域边界_17

的二次方，它对异常值不具有鲁棒性。总变化对离群值更健壮，但仅对分段恒定图像最佳。因此，当应用于平滑图像时，它可能会产生不希望的阶梯效果[43]。

Mumford-Shah实用。总变化的一个众所周知的扩展是所谓的Mumford-Shah函数：分段恒定图像U(r)拟合到I(r)以及与恒定灰度级区域的轮廓的总长度有关的项被添加到J [44]。文献[36]提供了对总变异方法的调查，包括对Mumford-Shah函数的一些扩展。其他扩展涉及矢量值图像[45、46]，在图形[46]上定义的图像，去模糊应用程序[47、48]以及将图像分解为三个分量(滤波图像，纹理和噪声)[37]。图像处理中变分方法的数值方法和行为分析可以在[41,49]中找到。

通过非线性扩散使功能最小化。最小化问题

Image Processing and Analysis_8_Edge Detection_边缘检测_18

可以通过将扩散方程

Image Processing and Analysis_8_Edge Detection_边缘检测_19

演化为稳态来解决，初始条件为u(r，t)= l(r)，其中F 是Euler- 拉格朗日导数(或一阶变式)[50]。该观察结果将被认为彼此独立的图像处理的不同区域联系在一起。在[51，52]中提出了通过最小化各种泛函推导的扩散方程的示例。另一方面，不是所有形式为

Image Processing and Analysis_8_Edge Detection_区域边界_20

的扩散方程，其中W是一般的非线性函数，都可以从变分问题中得出。因此，非线性扩散的框架比功能最小化更为笼统。

非线性扩散已由[53]在图像处理中引入

Image Processing and Analysis_8_Edge Detection_区域边界_21

形式的扩散方程的研究，其中g是一个正的非增量函数，并且已经详细研究了g的高斯和洛伦兹选择。由于因数g(

Image Processing and Analysis_8_Edge Detection_边缘检测_22

)随着

Image Processing and Analysis_8_Edge Detection_边缘检测_22

而减小，因此在高梯度幅度的点(例如边缘)处的扩散较低(图7)。尽管已被广泛使用，但是该运算符有两个缺点：

•它对噪声没有鲁棒性，尤其是关于g(

Image Processing and Analysis_8_Edge Detection_边缘检测_22

)项。 •运算符会增强||∇u || 高于取决于g的某个阈值

Image Processing and Analysis_8_Edge Detection_边缘检测_25

的所有边，并模糊∥u∥

Image Processing and Analysis_8_Edge Detection_轮廓检测_26

的所有边。因此，出于边缘检测的目的，它没有消除比简单的梯度阈值更多的纹理或噪声。

关于第一点，已经提出了上述扩散方程的几个正则化形式[54，55]。关于第二点，已经提出了许多不同的扩散方程[50,56,57]。其中许多是由于等渗线 u(r, s)=常数(随着s的增加)的运动而产生的。特别是，已经非常关注扩散方程，其中W(u)仅取决于等渗线的局部曲率[50]。非线性扩散框架的其他扩展涉及冲击滤波器[58]，矢量值图像[59,60]以及基于小波的扩散方程的解[61]。非线性扩散和局部轮廓保持平滑器之间的联系，例如自适应平滑，双边滤波和均值偏移，在[29]中以及其中的参考文献中进行了显示。

Image Processing and Analysis_8_Edge Detection_区域边界_27

图7.从左到右：合成输入图像以及线性和非线性扩散的结果。

该框架还提供了可能自然地组合适用于不同补充任务的图像处理方案的可能性：例如，如果M算子以扩散方程的形式

Image Processing and Analysis_8_Edge Detection_区域边界_28

表示，则可以从扩散方程

Image Processing and Analysis_8_Edge Detection_轮廓检测_29

获得新的算子，

Image Processing and Analysis_8_Edge Detection_区域边界_30

。一个例子是高斯模糊形态学锐化的组合，这导致了高斯-夸瓦哈拉滤波器的PDE公式[27]。

2.3.讨论

总而言之，旨在减少纹理和噪声同时保留或增强对象轮廓的预处理是轮廓检测的重要方面。经典的局部自适应平滑技术，例如双边过滤，均值漂移和值以及标准过滤器结构在存在自然纹理和高斯噪声的情况下具有良好的性能，而VOS过滤器更适合于去除盐和胡椒噪声。前面提到的大多数非线性滤波器都可以合并到PDEs的框架中。它还提供了自然组合可用于不同补充任务的图像处理方案的可能性。 PDEs 的公式非常通用，因为在特殊情况下，它包含几个局部轮廓保持平滑器，以及基于功能最小化的运算符。 PDE方法的主要局限性在于该方法的迭代性质以及需要通常由启发式方法定义的迭代停止规则的计算复杂性。

3.局部模式分析
3.1.差分运算符

连续公式：输入亮度曲线的不连续性可以检测为高梯度幅度的点。因此，人们对图像的差分结构投入了很多兴趣。在本节中，我们使用量规坐标u和v [62]，定义它们的目的是使线u = constant和v = constant分别正交于并平行于局部梯度方向。在这些坐标中，梯度量仅是一阶导数

Image Processing and Analysis_8_Edge Detection_轮廓检测_31

，边被标识为l_v在v方向上的局部最大值，因此它们满足条件l_{v v} = 0和l_{v v v} <0。 l_vv通常由拉普拉斯

Image Processing and Analysis_8_Edge Detection_边缘检测_32

= l_uu + l_{v v} [63，64]代替，它是线性的，计算量较小，并且l_{v v}近似良好(特别是，两个算子在零曲率点重合，对于l_uu = 0 )。在[65]中可以找到l_{v v}和

Image Processing and Analysis_8_Edge Detection_边缘检测_32

的边缘检测精度的定量比较。基于输入图像及其拉普拉斯算子的线性组合的生物驱动方法已证明比单独的拉普拉斯算子具有更好的边缘精度[66，67]。不满足条件l_{v v v} <0的l_{v v}(或拉普拉斯算子)的零交叉是梯度幅度的局部最小值，并且不对应于真实边缘。它们在文献中被称为幻影边缘，并已进行了详尽的研究[68]。

离散配方。如[69]中指出的，数字图像导数的计算是一个不适定的问题。为了对其进行正则化，文献中已经提出了几种基于输入的低通预滤波的方法。最早的线性滤波方法，例如Sobel，Prewitt，Beaudet和Robert边缘检测器[70]，是基于N(r)上像素值与给定边缘模板之间的匹配度量。在[71]中已经提出了包括这些边缘检测器作为其特殊情况的通用框架。Canny建议根据以下三个标准来优化模板过滤器：良好的检测，良好的定位和较低的多重响应[72,73]。他发现用于阶跃边缘检测的最佳滤波器非常接近输入与高斯函数的一阶导数的卷积。这等效于通过使用相同的高斯函数对输入图像进行卷积处理来计算输入图像的梯度(图8)。在[74]中已将Canny准则应用于其他类型的边缘，例如坡道和屋顶边缘。这些标准的离散版本已在[75,76]中提出。

Image Processing and Analysis_8_Edge Detection_边缘检测_34

图8的实验已经证明了这些图像。通过将I与G_σ的x和y导数进行卷积，可以有效地计算出通过使用高斯函数G_σ卷积进行平滑处理后的输入图像I的梯度。注意，结果取决于比例参数σ。

正规化区分离散支持上定义的函数的不适定问题的另一种方法是用拟合函数f(x，y)拟合每个像素周围的局部图案，并分析计算f(x，y)的导数[77,78]。最著名的拟合函数是多项式，其系数通过最小化均方误差来获得。在这种情况下，可以通过线性过滤来计算系数，并且将给定点的f(x，y)的导数表示为这些系数的线性组合[79,80]。在[81]中，表明局部函数拟合与可用函数有关。在[81]中利用这一事实进行有效的边缘检测，并在[82]中提出了基于Zernike矩的模型。在[83]中，三次样条模型用于检测屋顶边缘，在[84,85]中，提出了基于正则三次样条模型的比例空间。如果拟合函数f(x，y)不是多项式，或者拟合标准不是均方误差的最小值，则该过程不再是线性的。在[86]中可以找到对线性和非线性拟合模型的最新研究，并将其应用于边缘检测。

微分方法最重要的局限性在于，它们不区分一方面的纹理边缘与另一方面的区域边界和对象轮廓。最后，我们注意到Canny方法[73]是迄今为止最受欢迎的微分算子，它几乎已成为边缘检测的代名词。

3.2.统计方法

Image Processing and Analysis_8_Edge Detection_轮廓检测_13

将N(r)分为两个相等的部分

Image Processing and Analysis_8_Edge Detection_轮廓检测_36

，并使用独立性的两个样本统计检验来测量两个半部分之间的不相似性。高的相异性值表明存在区域边界。对多个方向重复进行此分析，并将引起最大差异的方向视为局部轮廓方向。为此，已经部署了一些两个样本的统计检验，例如 χ ² [87]，似然比[88]，Wilkoxon [89]，T [89]和Kolmogorov-Smirnov检验[89]。

这些检测纹理过渡的方法的有效性如图9所示。在[90]中，这些思想已经扩展到彩色图像：两个半邻区的颜色分布是通过矢量量化算法根据紧凑的颜色特征来描述的。色标之间的地球移动距离[91]用于检测轮廓的存在(图10)。最近，在[2,92,93]中，此方法已扩展到纹理。这些方法具有良好的性能，但是对计算的要求很高，因为必须对每个点的多个方向重复进行统计分析。此外，在存在高曲率轮廓点或比N(r)窄的细长物体(例如，浅色，金属丝，细血管等)的情况下，半圆形是不合适的。

Image Processing and Analysis_8_Edge Detection_区域边界_37

图9.从左到右：平均亮度均匀的合成输入图像，按照[73]计算其高斯梯度幅度，并通过[87]提出的统计分析获得局部边缘强度。与差分方法不同，统计方法可以检测平均亮度相同的不同纹理区域之间的过渡。

Image Processing and Analysis_8_Edge Detection_轮廓检测_38

图10.通过局部颜色和纹理图案的统计分析进行边缘检测[2,91]。

其他统计方法着眼于通过分析梯度的协方差矩阵Q来检测梯度轮廓的分布。局部轮廓强度和局部轮廓取向是从Q的特征值和特征向量得出的(图11)。其他算法[96,97]仅使用N(r)内部的梯度方向，轮廓的存在以低角度分散为特征。这些差分统计方法能够检测轮廓和线条。它们的特征在于两个比例尺参数：N(r)的大小和用于估计梯度的邻域半径。对于轮廓检测应用，两个比例尺参数应近似相等。但是，如果前者比后者大得多，则可以将这些方法用于方向纹理的统计分析[95]。部署用于轮廓检测的其他局部统计数据基于共现矩阵[98]和其颜色与中央像素的颜色足够相似的像素部分[99]。

Image Processing and Analysis_8_Edge Detection_区域边界_39

图11.从左到右：从梯度协方差，局部灰度分布[89]的统计分析和梯度幅度获得的合成输入图像和局部边缘强度。与微分方法和局部亮度分布的统计分析不同，梯度协方差方法可以检测不同方向的纹理之间的过渡。

总而言之，基于局部统计分析的算法比差分方法更有效：实际上，它们检测由颜色和纹理过渡确定的边缘，但同时，对计算的要求更高。

3.3.相一致和局部能量

相位一致。 Oppenheim和Lim [100]的实验证明了相位在人类感知图像中的重要性。进一步的心理证据[101,102]指出，人类视觉系统对自然图像中相位信息高度有序的点有强烈的反应。通过引入一维信号x(t)的相位一致，在[103]中提出了这种现象的计算模型，定义为

Image Processing and Analysis_8_Edge Detection_轮廓检测_40

是x(t)的傅立叶变换的幅度和相位。在所有傅立叶分量同相的点上，该数量始终在0和1之间，为1(图12)。对于2D信号，可以通过考虑图像的1D投影来计算不同方向的相位一致性。可以看出，这些点对应于明显的视觉事件，例如台阶，峰顶和屋顶边缘[104]。因此，可以通过分析相位一致性来执行边缘提取。

Image Processing and Analysis_8_Edge Detection_边缘检测_41

图12：从左到右：一维台阶和屋顶边缘的傅立叶分解，以及相应的相全图。在边缘点，所有组件都同相。

当地能源。在[103]中，显示了PC(t)的局部最大值对应于分析信号x(t)= x(t)+ i x_H(t)的大小的局部最大值，其中x_H(t)是希尔伯特变换x(t)的x_H(t)的计算涉及整个频谱，而许多计算机视觉应用程序都需要空间和频率定位。因此，将x(t)和x_H(t)替换为它们的带通版本。因此，代替解析信号，计算称为局部能量的量

Image Processing and Analysis_8_Edge Detection_轮廓检测_42

，其中f_e(t)和f_o(t)是对称函数和反对称函数，从而f_o(t)是希尔伯特变换f_e(t)的已经研究了几对函数f_e(t)和f_o(t)，这些函数产生了文献中称为正交对滤波器的滤波器，例如Gabor，Log-Gabor，Gaussian导数，Gaussians差和Cauchy功能[105]。其他例子是鲁棒的正交滤波器[106]和在坎尼准则[75]的意义上的最佳滤波器。这些过滤器的最新比较研究已在[105]中提出。最著名的正交滤波器是Gabor能量滤波器，它在空间和频率不确定性之间提供了最佳折衷方案[107]。可以在[108]中找到对其特性和应用的最新调查。

从1D到2D。将这些滤波器扩展到多维情况并不容易，因为不可能找到各向同性和反对称的标量函数。解决这个问题的最常见方法是针对不同方向实现各向异性正交滤波器，然后将输出与某种算法结合起来(有关简要概述，请参见[105])。但是，这些方法通常基于试探法，并且线性度丢失。最近，在[109]中提出了一种优雅的分析信号泛化，称为单基因信号，其基础是矢量函数既可以是各向同性的又可以是反对称的。

应用。文献中已经提出了几种基于局部能量和相位一致性的边缘检测器和特征提取算法。在[104]中，提出了基于小波的相位一致性实现。在[110]中表明，与线性过滤不同，局部能量分析不仅可以识别台阶边缘，还可以识别屋顶边缘和峰顶边缘。在[111]中，引入了约束相位一致性的概念，显示了其检测边缘和其他显着特征(例如马赫带)的能力。在[112,113]中，局部能量模型用于检测较大的一组边缘特征，包括结和线端接。如[114]中讨论的那样，检测屋顶，线和马赫带边缘的局部能量模型的能力使该算子成为幂等。换句话说，给定输入图像I，基于局部能量的边缘检测器

Image Processing and Analysis_8_Edge Detection_轮廓检测_43

满足条件

Image Processing and Analysis_8_Edge Detection_轮廓检测_44

。其他发展可以在[115,116]中找到。

总之，局部能量和相位一致性方法的成功主要是由于(i)考虑了图像中相位的感知重要性，以及(ii)它们检测不同类型的边缘(例如台阶)的能力，坡道，屋顶和线，从而形成一个统一的框架。此外，基于相位一致性的边缘检测器满足幂等条件[114]。然而，对于实际应用，局部能量方法的执行与更快且概念上更简单的差分方法[2]相似。

3.4.VOS和形态学边缘检测器

VOS过滤器的一般框架已在第2.1节中介绍。在本节中，我们表明，使用适当的局部线性组合系数，这些滤波器会对输入亮度或颜色配置文件的不连续性做出反应。最简单的例子是形态梯度[117,118]，定义为I 在N(r)上的最大值和最小值之间的差，或者等效地，是膨胀和腐蚀结果之间的差：

Image Processing and Analysis_8_Edge Detection_区域边界_45

，可以重写作为

Image Processing and Analysis_8_Edge Detection_轮廓检测_46

。通过将绝对值替换为色彩空间中的适当范数，可以将最后一个方程式直接扩展到彩色图像(色彩形态梯度[119])。这种方法是快速的，但是对于离群值却不可靠。为了使它对异常值更加稳健，在[119]中，| I(p)-I(r)I的最高值被排除在最大值的计算之外。

在[120]中已经提出了一些具有更多非零系数的更复杂的滤波器。这些滤波器对高斯噪声，盐和胡椒噪声均具有鲁棒性，但以更高的计算复杂度为代价。这些和其他颜色边缘检测器的性能比较在[121]中进行了介绍。

一方面，这些算法与微分算子和上述基于线性过滤的其他算法有一些相似之处，因为它们计算邻域中N(r)的值的线性组合。不同之处在于，系数与等级相关，而不与空间位置相关。另一方面，它们通过计算值等级类似于本地统计分析。通常，VOS边缘检测器的计算成本低于统计方法。VOS处理矢量图像的自然方式导致其主要应用于彩色图像[120]。

3.5.结合当地特色

在前面的小节中，考虑了边缘检测问题的互补方面，考虑了不同的局部特征。为了将由不同的本地特征执行的信息组合在一起，已经做了相当大的努力。这个想法是利用可用的基本事实中包含的语义信息来训练在相关特征空间中工作的分类器。分类器返回一个我们称为边缘似然度L的量(例如后验概率或Fisher判别式[122])。阈值L等效于在相关特征空间中对具有最佳决策边界的边缘像素进行分类。

在[123]中，输入图像的每个像素都与一个二维特征向量关联，该特征向量的分量是通过梯度幅度和线性非位移不变模板匹配分析获得的。但是，决策边界不是从一般原则得出的。在[124]中，采用贝叶斯方法来衡量通过组合以下局部特征而带来的性能改进：梯度幅度，局部能量分析的输出[110]和尼兹伯格边缘强度[94]。在[2]中进行了更详尽的研究，其中考虑了更大的局部特征集，包括颜色和纹理梯度。在[2,125]中研究了边缘检测性能对分类器选择的依赖性。

3.6.讨论

本节中所讨论的大多数局部边缘特征都是基于线性滤波的，即基于围绕每个点r 的局部图案P(r)与固定模板T的内积。模板的设计方式是使输出预期在几种类型的边缘上较高，而在平坦或均匀纹理区域上较低。然而，通过简单地将P(r)乘以适当的因子，可以使〈T，P(r)〉为任意高或低。因此，无论使用哪种模板T，足够高的对比度噪声将始终比低对比度边缘产生更高的响应。由于这些问题，一些作者建议针对其他局部量(例如P(r)的方差或其他相关量)对内积进行归一化。但是，这些新功能还有其他一些局限性——例如，它们往往在对比度非常低的区域反应过度。为了解决这些问题，在3.2节中提出了多种用于边缘检测的非线性算子。但是，由于一些限制-例如高计算复杂度，较差的性能或在线性情况下必须采用类似的限制，因此非常直接地导致了简单的最佳解决方案。

上述局部方法的一个更严重的局限性是，仅基于每个点的小邻域来确定像素是否属于轮廓。另一方面，容易产生图像，其中在视觉上类似于边缘的局部图案不属于对象轮廓，反之亦然(参见例如图5)。这一事实促使许多作者开发出更复杂的方案，其中也考虑了全球信息，下一部分将对此进行回顾。

4.上下文和全局方法

为了在轮廓检测中使用上下文信息和全局信息，已经做出了相当大的努力。这些方法可以分为三类：所谓的轮廓显着性的计算(第4.1节)，轮廓中的像素分组(第4.2节)和活动轮廓(第4.3节)。

4.1.轮廓突出

各种心理生理学和神经生理学研究(例如参见[126,127]及其参考文献)表明，周围环境中存在其他类似的刺激会影响人类视觉系统对定向刺激的反应。已经确定了两种机制：

•刺激与中心刺激共线；
•周围抑制或其他刺激的抑制。

这些发现启发了几位作者分两步进行轮廓检测(图13)：首先，计算了局部边缘强度L(r)(例如，作为梯度幅度或Gabor滤波器的响应)。其次，取决于周围环境，L(r)被禁止或增强。结果是信息量更大的G(r)，即轮廓显着性。

Image Processing and Analysis_8_Edge Detection_区域边界_47

图13：两步轮廓检测。局部上下文分析通过增强轮廓并减少纹理和噪声来提高对象轮廓的可见性。

环绕声抑制。 [22,128]中提出了一种简单的环绕声抑制模型。它基于抑制项T(r)的计算，该术语被定义为每个像素周围的环上L(r)的局部平均值。T在孤立的边缘上较低，在纹理上较高，因此从边缘强度中减去T会导致对纹理边缘的响应降低，因此提高了对象轮廓和区域边界的可见性，如图14所示。这种方法已经以几种方式得到了进一步发展：在[129]中，环形抑制邻域沿着局部边缘方向分为两半，以消除轮廓的不希望的自抑制并减少沿区域边界的抑制。该模型也已集成在多分辨率框架中[130,131]，并与多阈值方法[132]结合在一起。可以将环绕声抑制作为后处理步骤应用于第3节中讨论的任何本地运算符的结果。到目前为止，它已被应用于微分(Canny)和局部能量(Gabor)方法。环绕抑制的主要优点是消除纹理边缘，应将其用于存在此类边缘问题的应用中。

Image Processing and Analysis_8_Edge Detection_区域边界_48

图14：从左到右：输入图像，梯度幅度，以梯度幅度的局部平均值计算的抑制项以及最终边缘强度。抑制项在纹理边缘较高，因此最终结果将抑制纹理边缘。

便利。关于简化，计算轮廓显着性的最著名方法之一是张量投票[133]。向量场E_x(r)，称为扩展场，与图像的每个像素x相关联(图15)。考虑到在r和x处的边沿方向，矢量E_x(r)沿曲线的方向在良好连续性方面最可能连接点r和x。 E的大小就是这种可能性的值，通常它是 r-x 和弧度(r，x)的递减函数。以此方式，图像的每个像素的特征在于图像中所有其他像素的值分布(所谓的票数)，并且从该分布的统计信息中获得了显着性图。在[134]中，考虑了协方差矩阵K，并且从K 的特征值和特征向量获得了显着性值和局部边缘方向。例如，在[135]中可以找到该技术的进一步发展。

Image Processing and Analysis_8_Edge Detection_区域边界_49

图15：在[134]中计算的扩展字段。

最近的工作[136,137]显示，类似于张量投票的方案可以成功地对在人类视觉系统的前端部分执行的简化和轮廓整合过程建模。大脑的这一部分被建模为3D神经元网格，对定向刺激做出反应。神经元在网格中位置的前两个坐标与边缘的空间位置有关，第三个坐标与边缘的方向有关。几个心理物理实验表明，可以通过张量投票之类的方法来模拟同时引起抑制和促进现象的神经相互作用。为了考虑抑制和促进作用，定义了特殊的扩展场，在心理物理学文献中被称为关联场[138]。有关相关生物学背景的概述，请参见[139,140]。在[141,142]中提出了基于抑制和促进的其他近期方法。

放宽标签。一个用于计算显着性的强大的基于概率图的框架是松弛标记，它在[143]中引入，并在[144,145]中相继开发，并应用于轮廓检测。用其最简单的表示法，可以引入松弛标记，如下所示：令S = {s₁，…，s_N}为图G的一组节点，而L = {l1，…，l_m}为一组标记；每个节点还关联了一个可能的标签s_k的先验子集l_k∈L。标记是一个应用L：S↦L，它为每个对象s_k∈S分配一个标记L(s_k)∈l_k。现在让我们对所有可能的标记L的类别引入兼容性限制R。具体地说，对于{L(s_i)，L(s_k)}对属于给定集合L_i,k L_i×L_k的每个对(s_i，s_k)结点中通过边连接的节点，R允许标记L。通常，兼容性关系会减少可能标记的数量，如图16所示。

Image Processing and Analysis_8_Edge Detection_轮廓检测_50

图16：使用三个节点S = [A，B，C]和三个标签L =(1,2,3)的简单示例说明放松标签。 (a)具有先验集L_A，L_B，L_C和兼容性关系L_AB，L_BC的图形表示。 (b)所有可能的先验标签列表，其中第四和第五列上的星号分别表示L_AB和L_BC接受的组合。两种兼容性关系唯一允许使用的标签是(1、2、3)和(2、3、1)，它们打印在灰色背景上。

这种二进制表示法的主要局限性是，兼容性关系通常要么太严格，以致不允许标记，要么太宽松，如图16所示，其中允许多个标记。因此，通常优选对这种框架进行模糊修改，其中标记p是数字p_k(a)的矩阵，其中k = 1 ... N，a = 1 ... M，表示度将标签l_a分配给对象s_k的置信度；这些数字必须满足约束

Image Processing and Analysis_8_Edge Detection_轮廓检测_51

和

Image Processing and Analysis_8_Edge Detection_区域边界_52

。数字p_k(a)通常但不总是解释为概率。兼容性关系以实值函数r_i,k(a，

Image Processing and Analysis_8_Edge Detection_边缘检测_53

)的形式表示；它表示标签对象s_i与l_a和s_k与l

Image Processing and Analysis_8_Edge Detection_边缘检测_53

的兼容程度。人们通常应该给出兼容性，尽管对于某些应用程序，它们是从输入数据中学习的[146]。通过这些数量，可以引入与标记为p(定义为

Image Processing and Analysis_8_Edge Detection_边缘检测_55

)相关的所谓平均一致性a(p)；它测量分配给每个节点的标签相互一致的程度。

[147]中详细介绍了上述框架的一个有趣的概率解释，将松弛标记理论与图上的马尔可夫随机场优化理论联系起来[148]。特别是，在[147]中显示，当将数量p_k(a)解释为概率，而将r_i,k(a，

Image Processing and Analysis_8_Edge Detection_边缘检测_53

)解释为势时，则上面定义的平均一致性a(p)与吉布斯分布的能量与有关的马尔可夫模型有关。因此，松弛标记的主要问题是找到使a(p)最大化的标记p，在MRF公式中，它对应于找到与最大后验概率相对应的构型。当需要明确的标记时，将进一步的约束p_k(a)∈ {0,1} 施加到最小化。

这样的最大化问题是NP难的，即不能在多项式时间内解决[149]。解决松弛标记问题的经典方法是从合理的初始标记p₀开始，并使用一些类似于梯度下降的迭代方案来最大化a(p)[150,151]。但是，由于达到最佳状态需要大量的迭代，因此这种简单的方法通常很慢。为了开发更有效的算法并研究理论条件，通过有限的步骤就可以达到最佳收敛，已经付出了很多努力。最重要的方法是图扩散[152]，置信传播[153]，树的凸组合[154,155]，最大和扩散以及扩充有向无环图算法[149]。这些方法中的大多数都尝试最小化a(p)的上限，相对于a(p)的直接最大化，这在速度方面提供了更好的性能。但是，它们的主要缺点是，从理论上不能保证它们收敛的点是所需的最佳值。

在轮廓检测的情况下，松弛标记的应用如下：首先构造一个图，其节点是输入图像的像素，其弧线链接相邻的像素(根据给定的邻域概念)。必须为每个像素分配一个标签(可以是二进制，实数或矢量值)，以指示给定点可以被视为对象轮廓的可信度。兼容性关系r_i,k(a，

Image Processing and Analysis_8_Edge Detection_边缘检测_53

)传达上下文信息；具体而言，r_i,k(a，

Image Processing and Analysis_8_Edge Detection_边缘检测_53

)对于共线的边缘对较高，而对于随机放置的边缘则较低。因此，最大化a(p)的函数p_k(a)可以解释为轮廓的整体显着性。在实践中，通过使用局部边缘信息初始化标签，并迭代更新标签，以增强基础对象轮廓并抑制不期望的响应。在每次迭代中，每个标签都与其周围的标签相互作用，并且经过足够数量的迭代后，每个标签的值都由所有其他标签的值确定。这样，可以考虑全局上下文信息。最近的改进涉及在此框架中引入曲率[156]和纹理[151]信息。

总而言之，张量投票和张弛标记的两个框架提供了相似的算法，因为它们都归结为迭代方案，其中在每次迭代中，在存在共线边缘像素的长链的情况下，初始局部边缘强度得到了增强。松弛标记肯定优于张量投票的一个方面是，前者将轮廓检测作为优化问题而面临，并且依赖于更强的理论背景。因此，尽管张量投票可能会收敛到远离最佳值的局部最小值，但松弛标记可能有益于可用于马尔可夫随机场优化的退火程序，这有助于更接近全局最小值。

4.2.根据格式塔原理将像素分组为轮廓.

根据邻近的格式塔定律，良好的连续性以及最近的闭合[157](图17)和对称[158]，可以将边缘像素分为轮廓。图论是用于此目的的自然数学框架：图G的节点对应于边缘像素，并且节点之间的互连建模连续边缘之间的潜在链接。轮廓C由G的子图表示，并且通过最小化在G上计算的成本函数C进行检测。在本节中，我们将使用术语轮廓片段来表示该子图的连接组件。成本函数C通常定义为节点突出项与C之间的总和，节点突出项是局部边缘强度的递减函数，而互连亲和力项则考虑了相邻边缘对之间的共线性和共圆性[159-161]]。

Image Processing and Analysis_8_Edge Detection_边缘检测_59

图17：按照(左)良好延续性和(右)闭合性的格式定律分组。

有关此方法的未解决问题有两个：

•虽然已经正式解决了通过最小化成本函数对图形进行划分的数学问题，但在计算上却很棘手。因此，已经提出了各种各样的次优最小化算法，包括基于最小生成树[162]和Delaunay图[162,163]的计算方法。

•由于格式塔原则仅提供定性说明，因此将其转换为成本函数是任意的。

文献中已经提出了各种成本函数，包括几何模型[160]和概率模型[164]。最近，也得到心理物理学证据的证实[165,166]，在定义此类成本函数时也考虑了轮廓闭合[162,164,167,168]。轮廓封闭方法倾向于考虑更多的全局信息，并且能够检测虚幻的轮廓[169]。

关闭。通常，基于图的分组算法将闭包考虑在内，以y为周期的数学约束来识别G的子图G'，该子图G'使某个成本函数最小。在一些更高级的技术中，对G'施加了其他约束，例如凸度[170]或旋转指数，以防止自交叉循环[171]。例如，在[171]中，首先从边缘图上计算出一个稀疏连接的图G，方法是在邻近的格式塔定律和良好连续性的意义上，包括可能属于同一轮廓的连续边缘之间的弧。然后，检测到最短的非自相交周期并将其视为对象轮廓(因此，代价函数就是轮廓的像素数)。该方法不是很快，因为它的计算复杂度是O(n²logn)，其中n是边缘像素的数量。在[164]中提出了一种基于马尔可夫模型的更复杂的方法。具体来说，首先计算转换矩阵P，其中P_i,j 是包含边缘像素i 的路径也将包含边缘像素j 的条件概率。这些概率是根据[172]中提出的理论，根据邻近的格式塔定律和良好的连续性来计算的。结果表明，可以将P的特征值视为显着性度量，并且可以很容易地从P的特征向量(作为其强相关分量)中检测出周期。¹ 该方法比[171]中提出的轮廓检测方法更准确，并且速度更快，因为其计算复杂度为O(n²)。

1 A强连通分量C都是G'= V''

Image Processing and Analysis_8_Edge Detection_区域边界_60

的子图，这样，只要从G中的节点j可以到达节点i，则节点j为也可从节点j到达，且i，j∈V'[173]。

通过[174]中提出的称为比率轮廓的算法，可以进一步提高速度和精度。与其建立边缘分布的概率模型，不如根据轮廓片段之间的间隙的标准化长度和所检测边界的总曲率将简单的成本函数最小化。该成本函数倾向于偏向带有短间隙的平滑边界。间隙的长度和曲率项均相对于G'的给定连接分量中的像素数进行归一化，以防止偏向小物体。参数入控制曲率项相对于间隙长度项的相对重要性。等高线的检测如下：与[164,171]相似，根据Gestalt的邻近性和良好连续性定律，通过链接边缘像素来构造图G。然后，在G中检测到使上述成本函数最小的循环，并将其视为对象轮廓。此方法比上面提到的其他两个方法快，计算复杂度等于O(n^7/4)，并且可以更准确地检测轮廓。但是，其较高的性能是合理的。对没有理论依据的参数λ进行微调。

对称性：在更精细的方案中，通过寻找边缘像素组来考虑对称性，这些边缘像素在可能弯曲的对称轴周围表现出某种形式的全局或局部对称性。为了定义形状S∈R²的局部对称轴，引入了骨架的概念，通常将其定义为S的中间轴m。具体地说，将m定义为切线圆心的轨迹至少要在两个点上到达S的边界，而不接触S的内部(有关主题的概述，请参见[175，176])。根据定义，中间轴的点与形状边界等距，从而检测出局部对称性，如图18(左)所示。但是，众所周知，骨架化算法相对于输入形状S的扰动极为不稳定，因此会导致许多额外的尖峰偏离所需骨架，如图18所示。骨架的正确定义[177-179]。

Image Processing and Analysis_8_Edge Detection_边缘检测_61

图18：手的(左)合成和(右)真实形状，以及相应的中间轴。

[158]中提出了一种基于图形的方法，根据上述对称性定义对边缘像素进行分组。引入了一个新的成本函数作为两个项之间的比率：分子测量寻找的对称区域R的对称度，而分母等于R的面积。为了保证检测到的结构的对称性，引入分组令牌，将其定义为由先前检测到的边缘段构成的对称梯形。因此，分组算法将闭合边界标识为梯形序列，从而使上述成本函数最小。该方法能够在多项式时间内识别对称对象的边界，并且不会因成本函数的分母而偏向较小的对象。但是，它仍然很慢，因为其计算时间为O(n^5.5)，其中n表示线段的数量。在[180]中提出了一种更快的方法，其计算复杂度为O(n²)。但是，它偏向小对象，并且在优雅且易于解释的成本函数的意义上不是最佳的。在[181,182]中提出了更详细的对称对象检测方法，该方法与上述方法不同，使用其他纹理信息来识别在3D世界中对称但由于透视而导致图像不对称的对象歪斜。

与前面小节中讨论的许多方法(它们仅提供彼此不相关的边缘像素的二进制图)相比，此处引用的分组方法生成像素组，其中一组成员属于同一轮廓。通过这种方式，它们提供了对对象识别更有用的信息。但是，上述技术的主要缺点是它们的计算复杂度。为了提供快速算法，已经进行了许多研究。例子是形态学方法，它基本上趋向于通过方向性膨胀[183,184]和基于边缘之间某些距离函数的聚类算法来填充轮廓线段之间的间隙，该算法考虑了它们的接近度以及它们的共线性和同圆度[185,186]。对于边缘分组算法的概述以及对分组算法应具有的属性的最新讨论，请参考[10,187]。

4.3.活动轮廓

一般概念。主动轮廓，在文献中也称为蛇形或可变形模型，已在[188]中引入作为轮廓定位和交互式轮廓检测的变体方法。

想法是通过最小化能量函数E(图19)来形成用户围绕对象O绘制的曲线C。通常，能量E由两个项的总和得出：内部能量E_int测量C的平滑度，而外部能量E_ext考虑C与O的实际轮廓有多接近。在标准公式中，我们有E_int=

Image Processing and Analysis_8_Edge Detection_区域边界_62

和E_ext=

Image Processing and Analysis_8_Edge Detection_轮廓检测_63

，其中a和β是输入参数，g是一个递减函数，当

Image Processing and Analysis_8_Edge Detection_边缘检测_64

→o时g(

Image Processing and Analysis_8_Edge Detection_边缘检测_64

)→oo。通常，选择形式g(

Image Processing and Analysis_8_Edge Detection_边缘检测_64

)=(1+

Image Processing and Analysis_8_Edge Detection_边缘检测_64

^p)^-1，其中p为正参数。 E_int的两个项分别与C的长度和总曲率有关。另一方面，当C位于梯度幅度的最大值时，它为低。对于β= 0，可以证明上述函数可以重写为L_g(C)=

Image Processing and Analysis_8_Edge Detection_边缘检测_68

，其中rⁱ(s)，i = 1，2 是向量的分量，张量g_i,k(r)是向量的函数。输入图像I(r)(有关详细信息，请参见[189])。 L_g(C)解释为黎曼空间²中曲线C的测地线长度，其度量由输入图像确定。这个重要的结果将蛇理论和几何模型联系在一起，而蛇理论和几何模型在本质上是拓扑独立的[189]。2.黎曼空间是度量空间，其中点r =(x₁，x_n)和 r + dr =(x₁ + dx₁，...，x_n + dx_n)之间的无穷小距离由

Image Processing and Analysis_8_Edge Detection_边缘检测_69

给出。张量g_i,k(r)完全定义了R的度量。对于

Image Processing and Analysis_8_Edge Detection_边缘检测_70

，R缩减为普通的欧几里得空间。

Image Processing and Analysis_8_Edge Detection_区域边界_71

图19.用蛇确定轮廓。从左到右：分别绘制n和4、8、12、16次迭代后的手绘初始曲线和结果。

主动轮廓算法可以根据曲线C的表示方式分为两种类型。在参数蛇中，曲线由其参数方程r = r(s)表示，其中s∈ [0,1]和r(0 )= r(1)。变量s表示点r(0)和r(s)之间的曲线部分的弧长与整个曲线的长度之比。在水平集蛇中，C由函数

Image Processing and Analysis_8_Edge Detection_轮廓检测_72

(r)表示，该函数定义为C[190]上

Image Processing and Analysis_8_Edge Detection_轮廓检测_72

(r)= 0。这两个公式之间的主要区别在于处理拓扑变化：对于参数蛇，曲线C在其演化过程中保留其拓扑，除非在算法中集成了复杂的拆分和合并过程。水平集蛇更适合于拓扑更改，这在事先不知道必须检测的对象数量的情况下很有吸引力。但是，这会使该方法对噪声的鲁棒性降低，因为蛇会过度分裂。因此，也提出了拓扑保留级别集蛇模型[191,192]。对于最近对定级蛇的调查，我们参考[193]。

对于第3节中讨论的局部边缘检测器，蛇形模型具有几个优点，例如可以对检测到的轮廓施加连续性，平滑性和闭合性约束。而且，这些技术能够检测虚幻的轮廓[188]，这对于局部边缘检测器而言是不可能完成的任务。另一方面，E的最小化有几个缺点，例如对初始条件的依赖性强，收敛速度慢以及检测低对比度轮廓的能力差。为了克服这些缺点，文献中已经提出了对功能性E 的多种修饰。例如，傅立叶蛇[194]，有限元蛇[195]，双蛇[196]，模糊跟踪[197,198]，多分辨率方法[199]和受静电原理启发的模型[200]。在[201]中，已经提出了取决于边缘方向的外部能量。彩色图像的主动轮廓模型已经在[202]中提出。最近，大多数这些技术已在称为“联合蛇”的框架中统一[203]。有关概述，请参阅[204,205]。

与活动轮廓关联的扩散方程。一个重要的发展涉及E的最小值与形式为

Image Processing and Analysis_8_Edge Detection_轮廓检测_74

的扩散方程的解之间的等价关系，其中驱动力

Image Processing and Analysis_8_Edge Detection_区域边界_75

将蛇吸引到物体轮廓上。一旦外力不被限制为某个能量函数的梯度，该公式将变得比最小化E更通用。此类模型的一个相关示例是所谓的梯度矢量流[206, 207]。在[206]中，通过将

Image Processing and Analysis_8_Edge Detection_区域边界_76

作为初始条件，将外力定义为另一个非线性扩散过程的最终状态。与标准蛇形模型相比，GVF的主要优势是具有更好的将蛇形移入边界凹面的能力。

基于区域的活动轮廓。大多数上述方法的局限性是通过梯度幅度来计算的。使用此数量的缺点有两个：

•| ∇I|在低对比度的轮廓上取低值，从而使蛇塌陷[208]。

•| ∇I|在有噪声的情况下，蛇可能会很强壮，从而使蛇被不希望的局部极小值所吸引[209]。

这些问题可以通过引入防止塌陷的气球力来克服[195]，或者用更复杂的轮廓显着性代替梯度幅度[209]。但是，一种更有效的方法是将E计算为C内区域而不是边界上的积分之和。基于区域的蛇[210-212]对图像退化更健壮，对初始化更不敏感，因为有关基于轮廓的蛇涉及更多的全局统计信息。此外，基于区域的蛇可以更自然地与纹理模型集成[213]。

就其本质而言，基于区域的蛇与Mumford-Shah机能密切相关[44]。在[211]中，假定输入图像是逐段恒定亮度曲线U(r)的嘈杂版本，该曲线仅在两个未必相连的区域