文章目录
摘要
我们专注于检测有意义的线结构的基本任务,也就是自然场景中的语义线。以往的许多方法都将此问题视为目标检测的一种特殊情况,并调整现有的目标检测器以进行语义线检测。然而,这些方法忽略了线路的固有特性,导致了性能的次优。线具有比复杂对象的更简单的几何性质,因此可以通过一些参数紧凑地参数化。为了更好地利用线的性质,本文将经典的霍夫变换技术整合到深度学习表示中,并提出了一种用于线检测的一次性端到端学习框架。通过参数化具有斜率和偏差的线,我们执行霍夫th将深度表示转换为参数域,其中我们执行线检测。具体来说,我们沿着特征映射平面上的候选线聚合特征,然后将聚合的特征分配到参数域中的相应位置。.因此,将空间域中语义线的检测问题转化为发现参数域中的单个点,使后处理步骤即非最大抑制更有效。此外,我们的方法使它容易提取上下文线特征是至关重要的准确线检测。除了该方法外,我们还设计了一个评估度量来评估线路检测的质量,并构建了一个用于线路检测任务的大规模数据集。在我们提出的数据集和另一个公共数据集上的实验结果表明,我们的方法比以前的最先进的替代方案的优势。
论文的贡献
- 我们提出了一个端到端框架,将CNN的特征学习能力与Hough变换结合起来,从而产生了一个有效的实时语义线检测解决方案。
- 为了便于语义线检测的研究,我们构建了一个新的包含6500张图像的数据集,该数据集比以前的SEL数据集[11]更大、更多样化。
- 我们引入了一个有原则的度量标准来度量两条线之间的相似性。与之前基于IOU的度量[11]相比,我们的度量有直接的解释和简单的实现,详见Sec4。
- 在一个开放基准上的评估结果表明,我们的方法优于现有技术具有显著的提升。
主要的改进
- 我们提出了一种新的“边缘引导细化”模块来调整线的位置,并利用准确的边缘信息获得更好的检测性能。
- 我们引入了一个新的大规模数据集用于语义线检测,如章节所述。 5.新的数据集,即NKL(NanKaiLines的缩写),总共包含6500张图像,每个图像都由多个熟练的注释者进行注释。
- 我们使用最大二部图匹配[42]来匹配地面真实和检测线在评估(秒。6.1).匹配过程删除了冗余的真阳性,以便每个地面真值线最多与一条检测到的线相关联,反之亦然。
参考
https://mmcheng.net/dhtline/