“
计算机视觉研究院
”
计算机视觉研究院专栏
作者:Edison_G
目标检测发展越来越火热,尤其现在的小目标检测越来越难突破。最近大量阅读了目标检测领域的高质量文献,今天首先分享一篇我个人觉得很不错的一个创新,可感知尺度的目标检测新网络,性能可达27FPS/38.5 mAP;55FPS/32.% mAP,优于TripleNet、RFBNet等网络!
1.前言
Single-shot探测器由于具有实时检测和提高性能的优点,近年来得到了广泛的关注。为了解决复杂的尺度变化,Single-shot探测器基于多个金字塔层进行尺度感知预测。然而,金字塔中的特征没有足够的尺度感知,这限制了检测性能。可以观察到由物体尺度变化引起的单热探测器中的两个常见问题:
(1)小物体容易被遗漏;
(2)大物体的突出部分有时被检测为物体。
通过这一观察,作者就提出了一种新的邻域擦除和传输(NET)机制来重新配置金字塔特征和探索尺度感知特征。在NET中,设计了一个邻域擦除模块(NEM),用于擦除大目标的显著特征,并强调浅层小目标的特征。引入了一个邻域传输模块(NTM)来传输被擦除的特征,并在深层突出显示大目标。利用这种机制,构建了一个名为NETNet的Single-shot网络,用于感知尺度的对象检测。
此外,我觉得聚合最近的相邻金字塔特征来增强NET性能!
2.对比
上面一行是SSD,下面一行是NETNet结果。从第一金字塔层提取可视化特征,用于检测小目标。
False negative problem:由于小物体的特征在相应的金字塔特征(b)上不突出,所以(a)中漏掉了小物体(网球拍、运动的球)。NETNet可以通过擦除大目标的特征并将注意力集中在小目标上(如c,d)来检测高置信度的小目标。
Part false positive problem:头部被检测为基线中的另一个人,因为用于检测小目标的特征(f)上突出显示了该部分区域。NETNet可以通过抑制大目标的突出部分特征来解决这个问题,如(h)。
通过上面的几个结构,最终目的其实就是从浅金字塔层中删除大目标的特征,并生成用于检测小目标的小尺度感知特征。将浅层中的大目标的特征转移,增强深层的特征。然后构建了一个one-shot尺度感知检测器,用于更精确的目标检测。
3.新框架
Neighbor Erasing Module
计算这个spatial gate如下:
可以选择使用最大池化或平均池化沿着通道方向生成空间注意图(c=1),如下:
总之,通过 reversed gate来抑制较大目标的特征,从而为较小的目标Xs生成尺度感知特征P˜s:
Single-Shot Detector: NETNet
4.实验结果
最终实验结果如下:
实验可视化:
下次我们会专门详细分析实验的过程,以及该如何怎么去做好实验,在顶刊或高级会议发表Paper!一切都是有技巧,有规律的,感兴趣的同学请持续关注“计算机视觉研究院”!
Paper下载地址:https://arxiv.org/pdf/2001.06690.pdf
© THE END
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
计算机视觉研究院
长按扫描二维码关注我们
标签:特征,检测,尺度,NETNet,目标,干货,感知,金字塔 From: https://blog.51cto.com/u_15726357/5734576