首页 > 其他分享 >旋转角度目标检测的重要性!!!(附源论文下载)

旋转角度目标检测的重要性!!!(附源论文下载)

时间:2024-08-31 18:48:51浏览次数:4  
标签:特征 检测 论文 旋转 角度 重要性 目标 附源 研究院

https://mp.weixin.qq.com/s/NejkhzxvRlPqV42wLREFdg

旋转角度目标检测的重要性!!!(附源论文下载)

计算机视觉研究院 计算机视觉研究院    2024年08月31日 18:30 江苏

关注并星标

从此不迷路

计算机视觉研究院图片

图片

 

计算机视觉研究院 计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”! 2078篇原创内容 公众号

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

图片

论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517

计算机视觉研究院专栏

任意方向的目标检测是一项具有挑战性的任务。

 

一、背景

 

目标检测是计算机视觉中的一项基本任务,许多研究人员已经应用水平边界框来定位图像中的物体。 水平边界框的使用可以使候选区域的表示更加简洁直观。 在许多基于深度学习的方法中,往往需要大量标记样本来训练目标检测器模型,使用轴平行标记框可以大大提高标记效率,快速获取大量标记样本。 此外,水平边界框涉及的参数较少,简化了检测模型的训练过程。 因此,在大多数目标检测方法中,使用水平边界框来表示遥感图像中目标的大致范围,如下图所示。

图片

然而,航拍图像中的物体通常是任意方向的。因此,使用水平边界框来检测目标会引起几个问题。首先,这种类型的物体检测框通常包含许多背景区域。如上图(a)所示,图中大约60%的区域属于背景区域。检测框内存在过多的背景区域,不仅增加了分类任务的难度,而且会导致目标范围表示不准确的问题。其次,水平边界框会导致检测框之间出现强烈重叠,如上图(b)所示,降低检测精度。最后,由于飞机、船舶、车辆等图像中的物体包含运动方向信息,如果使用水平边界框,则无法获得目标运动方向的信息。

图片

上述三个问题可以通过使用带有角度信息的旋转检测框有效解决,如上图所示。首先,旋转检测可以精确定位图像中的物体,并且边界框几乎不包含背景区域,从而减少背景对物体分类的影响。其次,旋转检测框之间几乎没有重叠,从而可以更清晰地识别框内包含的物体。最后,可以从旋转检测框粗略得到物体的运动方向信息,从而判断物体的运动轨迹。综上所述,在遥感图像目标检测任务中使用带有角度信息的旋转检测框获得了优越的性能。
二、前言
任意方向的目标检测是一项具有挑战性的任务。由于遥感图像中的物体方向是任意的,使用水平边界框会导致检测精度低。现有的基于回归的旋转检测器会导致边界不连续的问题。在今天的分享中,研究者提出了一种基于角度分类的遥感图像目标检测方法,该方法使用带有角度信息的旋转检测边界框来检测对象。具体来说,研究者将神经架构搜索框架与特征金字塔网络 (NAS-FPN) 模块结合到密集检测器 (RetinaNet) 中,并在角度分类中使用二进制编码方法。这种方法减少了背景影响,使得检测框之间几乎没有重叠。根据检测框的角度,我们可以推断出目标的运动方向信息,进一步确定目标的运动轨迹。研究者对一个可用于航空影像 (DOTA) 中的目标检测的大型公共数据进行了消融实验,以验证该方法中每个模块的有效性,并将该方法与其他几种检测方法进行比较。实验结果证明了新提出方法的有效性。

 

三、新框架

 

图片

新提出的旋转检测器框架如上图所示。网络基于RetinaNet框架。图中标记为C2、C3、C4的特征图是由深度卷积神经网络提取的。该方法的总体步骤如下:首先利用特征提取网络对遥感图像中的特征进行提取,利用NAS-FPN对提取的特征进行融合,得到不同尺度的特征图。然后,使用长边定义方法来表示旋转检测框,并在框回归任务中使用二进制编码标记技术将角度回归问题转化为角度分类问题。下面详细描述该方法中的一些重要结构。

NAS-FPN

在NAS-FPN中,最重要的结构是由特征图节点集合、操作池和搜索终止条件组成的合并单元结构。下图简要描述了特征图的搜索过程。

图片

1)从特征图节点集中随机选择一个特征图作为输入之一。初始特征图节点集包含五个尺度的特征图,表示为 {C1,C2, C3, C4, C5}。

2)从特征图节点集中随机选择另一个特征图作为另一个输入。

3)选择输出特征图的分辨率。

4)在操作池中选择一个操作对(1)(2)中选择的特征图节点进行操作,产生与输出特征图分辨率相同的特征图,并将该特征图加入到特征图节点集合中选择。

5) 循环重复上述步骤。搜索的终止条件是生成五个与初始特征图分辨率相同的特征金字塔网络,记为{P1, P2, P3, P4, P5}。

ROTATION DETECTION FRAME

典型的角度编码方法有三种,包括两种不同角度范围的五参数方法和一种八参数方法。详细情况如下:

图片

角度范围为90°的五参数法(OpenCV定义法):其示意图如上图所示。该定义法包含五个参数[x,y,w,h,θ]。其中,x和y为旋转坐标系的中心坐标,θ为旋转坐标系与x轴的锐角,逆时针方向指定为负角,因此角度范围为[−90° , 0); 旋转框的宽度w为旋转框所在的边角,旋转框的高度h为另一边。

图片

180°角范围的五参数法

 

图片

八参数法

八参数法:该定义方法示意图如上图所示,该定义方法包含8个参数[a1,a2,b1,b2,c1,c2,d1,d2], 定义的左上角为起点,其余点按逆时针顺序排列。旋转坐标系的表示不限于上述三种方法,旋转坐标系其余部分的表示可以通过上述三种方法的变换得到。

ANGLE CODING METHOD

图片

90°范围的五参数定义方法的问题

图片

八参数四边形定义方法的问题

角度编码方法:

图片

图片

 

四、实验及可视化

 

实验环境

图片

 

DOTA数据集上的性能比较

图片

 

图片

图片

图片

END

图片
图片

 

转载请联系本公众号获得授权

图片

 

计算机视觉研究院学习群等你加入!

 

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

图片

 

 往期推荐 

标签:特征,检测,论文,旋转,角度,重要性,目标,附源,研究院
From: https://www.cnblogs.com/shuimuqingyang/p/18390592

相关文章

  • AI写论文文献综述全指南:从理论到实践的全面解析
    在当今文献资料数量呈爆炸式的时代,如何快速的撰写一份高质量的论文文献综述成为了不得不面对的难题。随着人工智能技术的发展为文献综述的撰写提供了新的思路和方法,利用AI写论文文献综述可以大大的提高论文写作效率和质量。一、引言面对海量的文献资料,需要我们具备较高的学术......
  • 医院设备管理系统的设计与实现 毕业设计-附源码39673
    摘 要随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,医院当然也不能排除在外。医院设备管理系统是以实际运用为开发背景,运用软件工程开发方法,采用SSM技术构建的一个管理系统。整个开发过程首先对软件系统进行......
  • flask 电子设备租赁大数据可视化分析平台 毕业设计-附源码22746
    摘 要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对电子设备租赁大数据可视化分析平台等问题,对电子设备租赁大数据可视化分析平台进行研究分析,然......
  • [开题报告]flask框架的殡仪馆信息管理系统设计与实现(python+程序+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的进步和人口老龄化的加剧,殡葬服务行业面临着前所未有的挑战与机遇。传统的手工记录与管理方式已难以满足现代殡仪馆高效、规范、......
  • [开题报告]flask框架的毕业生求职系统的设计与实现k2r16(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着高等教育的普及和就业市场的日益竞争,毕业生在求职过程中面临着信息获取不对称、求职渠道有限、面试流程繁琐等挑战。传统的求职方式往......
  • [开题报告]flask框架宠物领养系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的进步和人们生活水平的提高,宠物已逐渐成为现代家庭的重要成员,为人们的生活带来了无尽的欢乐与陪伴。然而,宠物数量的快速增长也带......
  • [开题报告]flask框架春荣公司人事管理系统设计与实现(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景在当今快速发展的商业环境中,人力资源管理已成为企业核心竞争力的重要组成部分。随着企业规模的扩大和员工数量的增加,传统的人事管理方式已......
  • CS专业科研论文绘图,及演示动画可用的工具
      1、2D绘图演示图:PowerPoint,Keynote, Visio,位图:AdobePhotoshop, 矢量图:Illustrator,CorelDRAW 排版:Indesign 2、3D建模3D模型:3dsMax,Rhino, 3、动画演示2D、3D动画:Canva(类ppt), Maya,C4D,AdobeAnimate,AdobeAfterEffects,KeyShot,Blender,ToonBoomHarmony......
  • java+vue计算机毕设信阳新型职业农民在线培育平台【源码+开题+论文】
    本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景信阳作为河南省的重要农业区域,其农业发展对于地方经济具有举足轻重的地位。然而,随着现代农业技术的快速发展和市场需求的不断变化,传统农民面临着知识......
  • java+vue计算机毕设学生信息管理系统【源码+开题+论文】
    本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景在当今信息化快速发展的时代,学校的管理效率与服务质量对学生及教职工的学习与生活产生着深远影响。传统的学生信息管理方式依赖纸质文档和人工操作,不......