ECCV 2022 | FPN：You Should Look at All Objects

标签：基于 Look ECCV 特征检测 FPN 目标金字塔

前言论文指出，大规模目标的性能下降是由于集成FPN后出现了不正确的反向传播路径。它使得骨干网络的每一层仅具有查看特定尺度范围内的目标的能力。基于这些分析，提出了两种可行的策略，以使主干的每一层都能够查看基于FPN的检测框架中的所有目标。
一种是引入辅助目标函数，使每个主干层在训练期间直接接收各种尺度目标的反向传播信号。另一种是以更合理的方式构造特征金字塔，以避免不合理的反向传播路径。在COCO基准上的大量实验验证了分析的正确性和方法的有效性。

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。目前公众号正在征稿中，可以获取对应的稿费哦。

QQ交流群: 444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。

论文：https://arxiv.org/pdf/2207.07889.pdf

代码：未公开

创新思路

随着深度神经网络的发展，近年来在目标检测方面取得了显著进展，目标检测旨在检测预定义类别的目标。最先进的检测器成功的共同点是使用特征金字塔网络（FPN）。

但在引入FPN后，发现总体检测性能的提高是建立在小目标（APS）平均精度的提高和大目标（APL）平均精度下降的基础上。例如，图1中基于MMDetection和Detectron2的实验证明了这种现象。

图1.基于MMDetection和Detectron2比较ResNet-50-DC5和ResNet-50FPN之间的检测性能。

本文做出了两个假设，说明为什么引入FPN有效。

1.FPN的使用有助于通过融合多个低级和高级特征图来获得更好的表示。

2.每个金字塔级别可以负责检测特定尺度范围内的目标。

这两种假设应得出相同的结论，即AP的增加是由于AP、APM和APL的共同增加。然而，图1中APL的意外下降表明无FPN和基于FPN的检测框架之间存在其他关键差异，但很少有研究注意到这一点。

因此，在本文中，作者提出从优化的角度研究FPN。除了多尺度特征融合和分治之外，FPN改变的反向传播路径也将直接影响检测框架的性能。实现具有不同尺度范围的目标的AP的一致改进的关键点是使每个主干阶段能够在训练期间看到所有目标。基于这一原理，作者提出了扩展和修正基于FPN的检测框架中现有的反向传播路径。

本文的主要贡献

1. 这是首次从优化的角度说明FPN成功的本质。此外，还提供了新的视角来解释为什么引入传统的FPN会从这个角度抑制大型目标的性能。

2. 提出了引入由不确定性引导的辅助目标函数，以缓解APS、APM和APL的不一致变化。由于该策略在测试期间没有额外的计算开销，因此可以保持检测器的推理速度不降低。

3. 提出了一种新的特征金字塔概括范式。其关键思想是使各种尺度目标的反向传播信号能够直接传递到骨干网络的各个层次。还进一步设计了级联结构，以实现更稳健的平均精度（AP）改进。

4. 在COCO 基准上进行的大量实验验证了分析的合理性和解决方案的有效性。本文的方法在各种框架下（one-stage, two-stage, anchor-based, anchor-free and transformer-based detectors.）的检测性能提高了2%以上。

准备

基于FPN的检测框架

对于基于FPN的检测器，首先使用C构建特征金字塔，如下所示:

在不失一般性的前提下，将式(4)改写为:

然后，网络使用P来预测分配到每个金字塔层次l的目标的分类和回归信息如下:

目标分配规则是用低分辨率金字塔特征(如P5)来预测大尺度目标，用高分辨率金字塔特征(如P2)来预测小尺度目标。在网络优化过程中，金字塔每一级l的损失计算如下:

FPN分析

引入FPN可以改变目标函数和骨干网之间的反向传播路径。图2显示了不使用FPN和基于FPN的检测框架之间的差异。在无FPN检测管道中，只有骨干特征C5直接受目标函数的监督。

图2。无FPN检测框架和基于FPN检测框架的反向传播路径的比较

由于深度神经网络中存在梯度消失问题，骨干网的浅层(即{fs0, fs1, fs2, fs3})将难以通过反向传播得到有效监督。而在基于FPN的检测框架中，所有的骨干特征都直接处于目标函数的监督之下。由于该策略避免了浅层的梯度消失问题，使得骨干网络的每一层都可以接受更多的监督来训练自己的参数。

为论证上述原理，作者进行了研究，实验结果如图3所示。

图3.不同设置下的检测性能。

FPN-Aux和DC5-Aux在骨干网络的浅层引入辅助损失。有

对于两级检测器，为了避免重复计算方案，将利用Eq.(2)或Eq.(6)计算的方案提取ROI。

则辅助损失如下:

检测框架的最终损失为辅助损失与原始损失之和。从图3中可以看出，辅助损失可以提高无FPN检测器的检测性能(从39.0%提高到39.6%)，并获得与基于FPN检测器相似的AP结果(39.6% vs . 39.5%)。但是辅助损失的引入对于基于FPN的检测器(从39.5%到39.5%)是无用的。这一结果验证了作者从优化角度的假设，FPN成功的本质是缩短了目标损失与骨干网络浅层之间的反向传播距离。

方法

辅助损失

由于引入辅助损失可以帮助拥有查看所有目标的能力，作者提出了将不确定性纳入到各个分类和回归辅助损失中，如下: