首页 > 其他分享 >可见光遥感目标检测(一)任务概要介绍

可见光遥感目标检测(一)任务概要介绍

时间:2023-04-30 20:14:37浏览次数:45  
标签:概要 检测 可见光 目标 遥感 图像 数据 CV

前言 本篇开始对遥感图像的目标检测进行介绍,介绍了其目标前景、数据集以及评价指标。

本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!

遥感图像介绍

本文介绍的是可见光遥感图像上的目标检测,首先我们来了解一下什么是遥感图像,遥感图像,也称为高分辨率遥感图像(Very High-resolution Imagery),但是在遥感图像的领域内,除了可见光遥感图像之外,还有其他两种遥感图像,一种是高光谱遥感图像(Hyperspectral Imagery),一种是雷达遥感图像(Synthetic Aperture Radar Imagery),其分类依据是根据成像的介质不同来进行分类的。我们主要用到的是高分辨率遥感图像,接下来说以下可见光遥感图像的成像优点。第一,其成像方式更符合我们人类眼睛成像方式;第二,其分辨率超高,能以更精细的分辨率产生地球表面的全色多光谱图像;第三,基于成像特点,对于进行图像分析(检测、分割等)十分友好。用一张图片直观的了解一下三种遥感图像的区别:

图1 a图是可见光,b图是高光谱,c图是雷达

遥感图像特点及应用前景

遥感图像图像特点主要包含如下几个方面:

  1. 背景复杂,目标信息少,背景信息多。
  2. 图像中物体的方向各不相同,这点在水平视角中不存在。
  3. 基于遥感图像的拍摄尺度高,导致图像中有较多的小物体。
  4. 目标尺度多样性复杂,一张图片中可能会同时存在飞机与汽车,明显飞机的尺度远远高于汽车的尺度。
  5. 图像中目标密集程度高,一张图片中可能会有多个目标,比如露天停车场。

上面这些特点,也是遥感图像算法设计中需要突出解决的问题。

简单总结遥感图像应用,我们从军用与民用的角度划分:

  1. 军用角度:舰船、飞机的检测、定位、追踪。
  2. 民用角度:港口调度、资源勘探、森林防护。

可见光遥感图像目标检测

目标检测是一个比较“古老”的话题了,它的分水岭是在2014年,以前的方法我们不做介绍,这里们说一下14年以后的深度学习具有代表性的算法。主流分为两类算法 — 一阶段检测与二阶段检测。二阶段比较早出现的,代表的算法有R-CNN、 FAST-RCN、 SPP-NE、 FASTER-RCNN。一阶段出现较晚,代表算法有YOLOV1 ------ YOLOV7系列等,后续还有anchor free系列的方法,Query-based以Transformer为代表的方法等等。

旋转目标检测(Oriented Object Detect)可以看作是目标检测的一个子集,它与通用的目标检测最大的不同之处在于我们需要在定位目标位置及其宽高的基础上还需要额外回归出其朝向。最常见的是在遥感图像中的目标检测任务,通过卫星、航空航天器等拍摄的图片中存在各种带有方向属性的目标比如船只,汽车等。由于这些目标在遥感图像中尺寸一般较小,传统的矩形框很难贴合满足我们的要求,这个时候就需要加上朝向来得到一个更为贴合的矩形框。

数据集

深度学习离不开数据集,只有大规模的数据才能得到更优秀的模型,下面介绍一下关于可见光遥感图像的数据集。

  1. DOTA系列数据集:2018年武汉大学首发DOTA1.0版本的数据集共分为15个类别,采用定向边界框的标注方式。DOTA数据集1.5版本共分为16个类别,DOTA数据集2.0版本共分为18个类别,DOTA数据集在数据的类别与质量上都明显优于其他遥感方向的数据集。随着版本的提升检测的挑战性越来越大,其中顶会论文使用1.0版本与1.5版本居多,鲜有用2.0版本。
  2. HRSC2016数据集:西北工业大学发布的数据集,包含从几个著名港口收集的大量条形定向物体,外观不同,用于船舶识别。整个数据集有1061幅图像,从300 × 300到1500 × 900不等。
  3. UCAS-AOD数据集:拥有1510张图片,其中510张汽车图片和1000张飞机图片。总共有14,596个实例。整个数据集按照5:2:3的比例随机分为755张用于训练的图像、302张用于验证的图像和453张用于测试的图像。所有图像的大小约为1280 × 659。
  4. DIOR数据集:含23463张图片和190288实例,覆盖20种目标,大小为800×800,比DOTA数据集更大!这20个对象类是飞机、机场、棒球场、篮球场、桥梁、烟囱、水坝、高速公路服务区、高速公路收费站、港口、高尔夫球场、地面田径场、天桥、船舶、体育场、储罐、网球场、火车站、车辆和风磨。
  5. LEVIR数据集:由大量 800 × 600 像素和0.2m〜1.0m /像素的高分辨率Google Earth图像和超过22k的图像组成。LEVIR数据集涵盖了人类居住环境的大多数类型地面特征,例如城市,乡村,山区和海洋。数据集中未考虑冰川,沙漠和戈壁等极端陆地环境。数据集中有3种目标类型:飞机,轮船(包括近海轮船和向海轮船)和油罐。所有图像总共标记了11k个独立边界框,包括4,724架飞机,3,025艘船和3,279个油罐。数据集图像简略观看 提供了四张图片,2张来自DOTA数据集,2张来自HRSC2016数据集
图2 来自HRSC2016数据集

不在贴放更多图片,提供了数据集的下载地址,有兴趣自己下载。

LEVIR数据集下载地址:https://pan.baidu.com/s/1eUAq2PszdHeE2VSG3q5cw 提取码: j9jp

DOTA数据集下载地址:https://pan.baidu.com/s/1o4Tsx7hgh2a2O73kxJRVLg 提取码: yvi1

UCAS-AOD数据集下载地址:https://pan.baidu.com/s/1Poo0zEHTHDfBTnKPb5YTCg 提取码: 7zsi

HRSC2016数据集下载地址:https://pan.baidu.com/s/1Sz2aohknDVCYrnXcnPQuaQ 提取码: 7fx1

常见评估指标

旋转目标检测的评估指标与通用目标检测指标基本一致采用AP50或mAP来评估,需要注意的是计算IOU的时候要使用旋转框来计算交并比。

另外在实验分析中我们也可以将角度偏小的水平框和角度偏大的旋转框分别评估AP来判断当前算法是否对大的角度目标有很好的性能。

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

穿越时空的智慧:经得起时间考验的深度学习理念

一次性分割一切,比SAM更强,华人团队的通用分割模型SEEM来了

目标检测中的框位置优化总结

CVPR'23|向CLIP学习预训练跨模态!简单高效的零样本参考图像分割方法

大模型微调项目 / 数据集调研汇总

CVPR23 Highlight|拥有top-down attention能力的vision transformer

视觉定位领域专栏(三)算法评估方法总结

视觉定位领域专栏(二)常用数据集介绍

视觉定位领域专栏(一)领域介绍、应用场景和研究难点

语义分割专栏(二)复习FCN的编解码结构

语义分割专栏(一)解读FCN

CUDA 教程(三)CUDA C 编程简介

目标跟踪(二)单、多目标跟踪的基本概念与常用数据集

【CV技术指南】咱们自己的CV全栈指导班、基础入门班、论文指导班 全面上线!!

即插即用模块 | RFAConv助力YOLOv8再涨2个点

CVPR 2023|21 篇数据集工作汇总(附打包下载链接)

CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey

LargeKernel3D:在3D稀疏CNN中使用大卷积核

ViT-Adapter:用于密集预测任务的视觉 Transformer Adapter

CodeGeeX 130亿参数大模型的调优笔记:比FasterTransformer更快的解决方案

分割一切还不够,还要检测一切、生成一切,SAM二创开始了

CVPR 2023 深挖无标签数据价值!SOLIDER:用于以人为中心的视觉

SegGPT:在上下文中分割一切

上线一天,4k star | Facebook:Segment Anything

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

聊聊计算机视觉入门

标签:概要,检测,可见光,目标,遥感,图像,数据,CV
From: https://www.cnblogs.com/wxkang/p/17365696.html

相关文章

  • 《Effective C#》系列之(零)——概要
    把全书的内容讲述完整可能需要很长时间,我可以先回答主要目录和核心的内容。如果您有任何特定问题或需要更详细的解释,请告诉我。《EffectiveC#》一书共包含50条C#编程建议,以下是其中的一些主要目录:1.理解C#的基础知识2.使代码更易于阅读和理解3.利用C#语言的新功能4.改进异......
  • DNF韩服手游脚本概要设计
    背景当角色到达65级之后,主要的工作就是凑装备,强化,打造词条,附魔等细节。其中投入最大,周期最长的就是强化了,从15到16保底至少需要500万泰拉,到20就更遥不可及,除了活动能够加快一些进度,主要就是靠【搬砖】。这篇文章旨在解决【搬砖的枯燥】与【人类对美好生活向往】之间的矛盾。毛......
  • 5月腾冲 | 2023年易智瑞遥感应用培训班报名开启
    传递遥感技术助力遥感应用2023年易智瑞遥感应用培训班—5月腾冲站 主办单位易智瑞信息技术有限公司培训简介遥感应用培训班自2009年启动以来,已经举办了14年。已先后在20多个城市举办了120多场培训,共有7000多名学员参加。每年培训班内容都会根据学......
  • 01. 接口测试基础知识概要
    01.接口测试基础知识概要概要软件接口的分类:软件内部模块与模块之间的接口、不同平台间的外部接口常见接口:HTTP协议:最广泛;常用JMeter和Postman工具来测试WebService接口:使用soap协议,通过http传输,一般是xml格式,常用SoapUI工具测试什么是接口测试:基于某种协议,模拟客......
  • Python ArcPy批量计算多时相遥感影像的各项元平均值
      本文介绍基于Python中ArcPy模块,对大量长时间序列栅格遥感影像文件的每一个像元进行多时序平均值的求取。  在遥感应用中,我们经常需要对某一景遥感影像中的全部像元的像素值进行平均值求取——这一操作很好实现,基于ArcMap软件或者简单的Python代码就可以实现;但有时候,我们会......
  • 农业大数据|提取遥感影像指定经纬度的WDRVI并与LAI回归分析
    实验目的​ 熟练遥感数据的处理流程;通过探讨地面测量的叶面积指数与遥感观测的植被指数关系,理解地面测量数据与遥感观测数据的联系。实验内容预处理遥感数据,得到WDRVI指数影像,并提取地面观测LAI对应时间,卫星观测的试验田所在位置的WDRVI均值。对比LAI与WDRVI指数,构建模型,绘......
  • sqlserver 分布式可用性组(一)—— 概要
    一、分布式可用性组简介分布式可用性组(DistributedAvailabilityGroup)是SQLServer2016中的新功能,它可跨两个单独的可用性组。两个可用性组无需处于同一位置:它们可以跨物理机、虚拟机;跨内网、云上;跨有域、无域;甚至跨平台(如Linux、Windows)。只要两个可用性组可以进行通信,就可以......
  • [技术讨论]网络交流模式的变迁——概要稿
    从98年开始到现在,国内网络交流模式从最初的论坛为主(98-2002年),即时通讯工具为主(约2002-2008年),SNS+即时通讯混合状态(2008年-现在)。1、最初以论坛为主的原因:网络刚刚形成,相互之间都不熟悉,直接使用即时通讯工具也没有太大意义,出了漫无目的的交友和聊天,即时通讯工具当时对比论坛并没有......
  • 典型案例分享:基于企业级的遥感监测水域现状分析系统
    传统的水质监测具有精度高、时效性高等优点,但是难以从长时间序列、全空间角度了解水质的变化趋势及其成因。随着遥感技术的发展,对水体环境进行区域性、整体性研究的方法趋于成熟。遥感监测水域现状分析系统是基于卫星遥感和IT技术研制了的企业级遥感应用系统,为日常的水环境综合......
  • 学习遥感的困惑
    象元就是论文中总提到的pixel即对地表信号的记录l,在线性混合模型中是l=wx+b。w是丰富度m维度(端成员数),x是不同端成员的信号b是噪音。    simplex是什么?论文说simplex映射后还是simplex应该是一个N-1维度的形体。 ......