首页 > 其他分享 >一、目标检测概述

一、目标检测概述

时间:2022-09-26 12:23:54浏览次数:68  
标签:输出 特征 检测 位置 目标 算法 概述

一、目标检测概述

1.什么是目标检测

目标检测定义识别图片中有哪些物体以及物体的位置(坐标位置)

2.传统目标算法到深度学习

2.1目标检测算法的变迁

image
对于传统的
将待检测作为输入图片,候选框的提取通常会通过滑动窗口的方法进行,对每一个窗口的局部性特征会采用传统的计算机视觉和模式识别一些比较表征的方法。分别为基于颜色,纹理,形状,以及一些中层次或者高层次的方法,有的是要经过学习来得到的方法,比如说凑趣直方图特征,纹理特征。提取方法之后会通过PCA对特征进行降维度,或者通过LDA对算法进行空间的投影。
分为三类:
(1)低层次的特征(手工设计的特征)
(2)中层次的特征:特征挖掘LDA之类的(学习的特征)
(3)高层次的特征:将低层次,中层次特征进行特征的挖掘
一般集中在第1,2类。
对于深度学习:
将特征提取的部分变成卷积神经网,候选框则通过一个RPN网络来完成(也就是twostage的目标检测算法),onestage的目标检测算法则通过直接回归的方法来获得可能得目标区域,位置,和目标的类别。

2.2算法基本流程

image
image

3.目标检测任务描述

3.1目标检测算法分类

(1)传统目标检测方法(候选区域+手工特征提取+分类器)
HOG+SVM、DPM(传统算法中比较好)
(2)region proposal+CNN提取分类的目标检测框架
(R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN)
image

(3)端到端(End-to-End)的目标检测框架
YOLO、SSD
image

3.2目标检测的常见指标

image

3.3目标定位的简单实现

在分类的时候我们直接输出各个类别的概率,如果再加上定位的话,我们可以考虑在网络的最后输出加上位置信息。
例如:增加一个全连接层,即为FC1、FC2FC1:作为类别的输出,FC2:作为这个物体位置数值的输出
假设有10个类别,输出[p1,p2,p3,...,p10],然后输出这一个对象的四个位置信息[x,y,w,h]
image

位置数值的处理(归一化)

对于输出的位置信息是四个比较大的像素大小值,在回归的时候不适合。目前统一的做法是,每个位置除以图片本身像素大小。

假设以中心坐标方式,那么x = x/x_image,y/y_image, w/x_image,h/y_image,也就是这几个点最后都变成了0~1之间的值(归一化)。
参考文档https://www.cnblogs.com/kongweisi/p/10894415.html
参考视频https://www.bilibili.com/video/BV1mb4y1H7ZB/?spm_id_from=333.999.0.0&vd_source=84555d77a58e708cf47319e185cf427a

标签:输出,特征,检测,位置,目标,算法,概述
From: https://www.cnblogs.com/GengGengTongXue/p/16730432.html

相关文章

  • flowable初体验踩坑及概述
    遵守bpmn2.0协议(前提)(还在找比较好用的绘图工具)可以使用idea插件进行绘图保存成xml进行改造编写FlowableBPMNvisualizer和JBossjBPM,暂时使用的是idea的这两个......
  • Junit_@Before@Afte和反射_概述
    Junit_@Before@Afte@Before:修饰的方法会在测试方法之前被自动执行@Afte:修饰的方法会在测试方法执行之后自动被执行测试类反射_概述反射:框架设计的灵魂框架......
  • Junit测试概述和Junit使用步骤
    Junit测试概述测试分类:黑盒测试:不需要写代码。给输入值,看程序是否能输出期望的值白盒测试:需要些代码的。关注程序具体的执行流程Junit使用步......
  • vue中检测不到数组或者对象发生改变,如何解决? vue更新数组时触发视图更新的方法
    vue中检测不到数组或者对象发生改变,如何解决? this.$set(对象/数组,键,值)Vue.set(对象/数组,键,值)给对象增加新属性、给数组增加属性都可以响应!this.$delete(对......
  • 001计算机概述
    001计算机概述1、什么是计算机Computer:全程电子计算机,俗称电脑。能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件和软件组成。常见的形式有台......
  • JavaWeb--JDBC:概述,DriverManager,Connection,Statement,ResultSet,PreparedStatement、数
    第一节  JDBC概述1、JDBC概念JDBC就是使用java语言操作关系数据库的一套API全称:(JavaDataBaseConnectivity)Java数据库连接2、JDBC本质......
  • 【前端必会】webpack的目标代码
    背景webpack生成什么样的代码呢?同的模块依赖的写法(import、exportexportdefault),会导致生成代码的不同,下面介绍普通的import与export开始导出PI1,max//index.jsletPI......
  • pygame各个模块概述
    在pygame中,有很多模块,每个模块对应着不同的功能,如果我们知道这些模块是做什么的,那么,对我们的游戏开发会起到关键性的作用。我们就说说pygame中的各个模块吧!!! #pyga......
  • 力扣1095——山脉数组中查找目标值
    1095.山脉数组中查找目标值难度困难(这是一个 交互式问题 )给你一个 山脉数组 mountainArr,请你返回能够使得 mountainArr.get(index) 等于 target 最小 的......
  • GraphQL概述
    一种用于API的查询语言GraphQL既是一种用于API的查询语言也是一个满足你数据查询的运行时。GraphQL对你的API中的数据提供了一套易于理解的完整描述,使得客户端......