首页 > 其他分享 >可见光遥感目标检测(二)主要难点与研究方法概述

可见光遥感目标检测(二)主要难点与研究方法概述

时间:2023-05-01 15:00:46浏览次数:54  
标签:难点 检测 可见光 目标 问题 遥感 图像 CV

前言 可见光遥感图像目标检测属于计算机视觉下面目标检测的重要分支,其具有常规目标检测的普遍性问题,又具有遥感图像目标检测的特殊性问题,针对遥感图像的特殊性问题与普遍性问题在目标检测的通用框架下做出改变与优化,以解决遥感图像目标检测的特殊性与普遍性问题。首先需要明确通用目标检测框架的部分构成,以便于后续在遥感图像检测问题明确哪部分做出改变,改变的地方怎么用在模型之中,做到提纲挈领,熟稔于心。

本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!

需要先验知识

1.1、通用目标检测框架构成

图1 目标检测框架图

现代目标检测框架主要由三个部分组成:

  • Backbone:主干网络,用来提取图像特征,广泛应用的网络如Resnet50、Resnet101系列,DenseNet,VGG等等。
  • Neck:主要用于进行特征融合等操作,如FPN,PAN及其各种变体。
  • Head:预测头,输入backbone和Neck提取的特征最终得到检测结果。

检测器又可以分为单阶段,两阶段、多阶段检测器,也可以分为anchor-based,anchor-free以及transfomer系列query-based等等,在这里不做展开。

1.2、优化思路

根据目标检测框架图,它的优化模型思路也比较清晰了:

  1. 想办法提高模型提取特征的能力,使用更加强力的Backbone,比如ResNext,Res2Net等等。
  2. 在Neck层想更多拌饭,考虑更加高效的融合特征,也就有了FPN的各种变种,PAN,Bifpn甚至采用NAS的思路搜索一个最佳的特征融合方案。
  3. Label Assignment优化,我们知道在目标检测中一个很关键的问题在于如何平衡网络学习的正负例样本,如何选择好的正样本,这些都是Label Assignment方向做的事情。
  4. 损失函数上的优化,这一部分在不仅仅是目标检测,在不同任务领域都是重中之重,比如平衡正负例样本,难易例样本的Focal loss,比如考虑用任意分布来做回归的GFL等等,面对不同的问题,我们需要设计更贴合实际的损失函数。

主要研究难点

上面讲到了通用目标检测的基本框架和一些常用的优化思路,下面我们一起来看看可见光遥感目标检测中都有哪些难点,它和通用目标检测都有哪些方面的不同。

1、旋转目标的检测问题,一直都是遥感图像目标检测的重要解决的问题。以前基于水平框的方法无法精确的包围遥感图像,所以提议生成带角度的旋转框来包围遥感图像。图2说明了生成旋转框的必要性。

图2 水平框与旋转框的效果对比

在处理旋转目标的检测问题时候,主要的思路是:1、旋转等变检测器,用来提取旋转不变特征,属于特征提取阶段。2、特征精细化模块,用于特征对齐,属于Head阶段的改进。3、自适应点来学习非轴向特征与任意方向特征,属于特征提取阶段。4、将水平关键点检测用到旋转关键点检测,去除锚框设置,属于Head部分改进。5、设计新的损失函数,属于反向传播优化参数阶段。 2、高纵横比问题,这个问题集中体现在遥感图像中船只的检测上面。因为船只属于瘦长目标,所以当角度发生很小的变化时,其包围框的变化是非常剧烈的。图3展示了高纵横比检测的特殊性。

图3 舰船检测的特殊性

在处理舰船这种高纵横比的问题上,主要思路是:1、中心点提取,通过关键点来定位舰船中心,属于Head部分改进。2、根据对象的形状信息和特征分布动态选择样本,属于特征提取部分的改进。3、累积特征金字塔,用来增强在各个尺度的语义信息,属于Neck部分改进。3、小目标的检测问题,小目标的检测问题不属于遥感图像特有的检测问题,属于目标检测的普遍性的问题,主要是由于小目标提供的像素点信息较少,无法提取到鲁棒性的特征。图4,展示了遥感目标检测的小目标问题。

图4 小目标检测问题

在处理小目标的检测问题上,主要的思路是:1、对于提取到的特征分配不同的重加权模块,属于特征提取阶段。2、基于接受区域的标签分配策略,属于Head部分改进。

4、复杂背景问题,由于遥感图像的视角开阔,得到的图像的尺寸往往大于一般的图像,这就使得图像里面的前景信息与背景信息极度不平衡,造成模型学习不到优质的前景信息。还会造成目标的重叠遮挡等问题,这就使得包围框的生成是不够准确的。图五展示了遥感图像中复杂的背景问题。

图5 复杂背景问题

在处理复杂背景的题上,主要的思路是:1、提出像素级别损失函数,更精确计算IoU面积,属于反向传播优化参数阶段.2、提出学习凸包特征方法,属于特征提取阶段。

5、密集物体检测,密集物体检测也不属于遥感图像专有的问题,密集的物体不利于包围框的生成,造成定位的不准确。图6展示遥感图像中密集物体检测问题。

图6 密集物体检测问题

在处理密集物体检测问题上,主要的思路是:提出新的角度标签编码策略,根据标签来设定新的损失函数,属于反向传播优化参数阶段.

6、遥感图像目标检测的新范式,由于Transormers的横空出世,把cv问题转变为了CNN与Transormers各占据半壁江山,现在也有很多用Transormers来做遥感图像目标检测,并且也取得了不错的效果,Transormers主要的有点是能够学习到图片的全局特征,但是其缺点是需要大量的数据才能够表现出最佳的性能。Transormers与CNN到底鹿死谁手,我们只能拭目以待。

后续的文章我会带大家从上面说到的遥感目标检测面临的实际问题以及不同的解决思路出发,以近年的主要论文为主,详细为大家介绍遥感目标检测~

 

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

穿越时空的智慧:经得起时间考验的深度学习理念

一次性分割一切,比SAM更强,华人团队的通用分割模型SEEM来了

目标检测中的框位置优化总结

CVPR'23|向CLIP学习预训练跨模态!简单高效的零样本参考图像分割方法

大模型微调项目 / 数据集调研汇总

CVPR23 Highlight|拥有top-down attention能力的vision transformer

视觉定位领域专栏(三)算法评估方法总结

视觉定位领域专栏(二)常用数据集介绍

视觉定位领域专栏(一)领域介绍、应用场景和研究难点

语义分割专栏(二)复习FCN的编解码结构

语义分割专栏(一)解读FCN

CUDA 教程(三)CUDA C 编程简介

目标跟踪(二)单、多目标跟踪的基本概念与常用数据集

【CV技术指南】咱们自己的CV全栈指导班、基础入门班、论文指导班 全面上线!!

即插即用模块 | RFAConv助力YOLOv8再涨2个点

CVPR 2023|21 篇数据集工作汇总(附打包下载链接)

CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey

LargeKernel3D:在3D稀疏CNN中使用大卷积核

ViT-Adapter:用于密集预测任务的视觉 Transformer Adapter

CodeGeeX 130亿参数大模型的调优笔记:比FasterTransformer更快的解决方案

分割一切还不够,还要检测一切、生成一切,SAM二创开始了

CVPR 2023 深挖无标签数据价值!SOLIDER:用于以人为中心的视觉

SegGPT:在上下文中分割一切

上线一天,4k star | Facebook:Segment Anything

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

聊聊计算机视觉入门

标签:难点,检测,可见光,目标,问题,遥感,图像,CV
From: https://www.cnblogs.com/wxkang/p/17366539.html

相关文章

  • 可见光遥感目标检测(一)任务概要介绍
    前言 本篇开始对遥感图像的目标检测进行介绍,介绍了其目标前景、数据集以及评价指标。本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各......
  • 视觉定位领域专栏(一)领域介绍、应用场景和研究难点
    前言 上一篇介绍了什么是视觉定位,以及视觉定位在各行各业的应用点和目前的研究难点在哪。本篇主要介绍视觉定位领域常用的一些数据集,分为室内定位数据集和室外定位数据集,每个数据集附有数据集获取地址和数据集样例。本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技......
  • 视觉定位领域专栏(一)领域介绍、应用场景和研究难点
    前言 本篇主要介绍三个方面,即视觉定位领域介绍、应用场景以及研究难点,同时会对专栏后续讲解内容做一个概述。本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文......
  • 图像识别的技术难点和突破,你掌握吗?
    图像识别是人工智能的一个重要分支,它涉及到计算机视觉、机器学习、深度学习等多个领域。图像识别的目标是让计算机能够像人类一样,对输入的图像进行理解和分析,从中提取出有用的信息。图像识别的技术难点和突破,你掌握吗?图像识别的技术难点主要有以下几个方面:-图像质量:图像可能存......
  • API 自动化测试难点分享
    笔者是API管理工具的项目参与者之一,在日常工作中会经常遇到API自动化测试难点,我决定总结分享给大家: API自动化测试的难点包括:接口的参数组合较多,需要覆盖各种可能的情况。接口的状态和数据关联较多,需要验证返回结果是否符合预期。接口的并发访问和性能测试较为复杂,需......
  • 计算机力学仿真的难点
    计算机力学仿真的难点主要在以下几个方面:建立准确的几何模型:力学仿真模型需要建立准确的几何模型,这包括材质、网格、约束等因素。建立准确的几何模型需要有扎实的数学和物理基础,以及丰富的实际经验。处理复杂的物理问题:力学仿真中经常会遇到各种复杂的物理问题,如摩擦、变形、应......
  • 5月腾冲 | 2023年易智瑞遥感应用培训班报名开启
    传递遥感技术助力遥感应用2023年易智瑞遥感应用培训班—5月腾冲站 主办单位易智瑞信息技术有限公司培训简介遥感应用培训班自2009年启动以来,已经举办了14年。已先后在20多个城市举办了120多场培训,共有7000多名学员参加。每年培训班内容都会根据学......
  • 英语四级难点单词之 conscientious
    conscientious是 良心的,尽责的意思单词"conscientious"来自于Latin语"conscius",意思是"知道"、"意识到"。它的后缀"-ous"表示"充满"的意思,因此"conscientious"可以理解为"充满责任心的、认真的、小心谨慎的"。充满意识,说明一个充满了认真和责任感对应的......
  • 语义分析中常常遇见的难点
    背景的像素占的面积太多,模型会更容易将背景区域识别为主体对象的一部分,从而导致模型的精度下降。这是因为模型会学习到将背景与主体对象分离的特征,如果背景占的面积过多,那么背景与主体对象的特征之间的区别就会变得模糊,导致模型无法准确地分离它们。另外,如果背景占的面积过多,会导......
  • Python ArcPy批量计算多时相遥感影像的各项元平均值
      本文介绍基于Python中ArcPy模块,对大量长时间序列栅格遥感影像文件的每一个像元进行多时序平均值的求取。  在遥感应用中,我们经常需要对某一景遥感影像中的全部像元的像素值进行平均值求取——这一操作很好实现,基于ArcMap软件或者简单的Python代码就可以实现;但有时候,我们会......