首页 > 编程语言 >综述 | 基于深度学习的目标检测算法

综述 | 基于深度学习的目标检测算法

时间:2022-12-15 18:09:29浏览次数:41  
标签:综述 检测 深度 目标 算法 搜索 图像 人脸 识别

计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。图像目标检测又是计算机视觉的关键任务,主要对图像或视频中的物体进行识别和定位,是AI后续应用的基础。

因此,检测性能的好坏直接影响到后续目标 追踪、动作识别的性能。传统图像目标检测的滑窗法虽然简单易于理解,但随目标大小而变化的窗口对图像进行从左 至右、从上至下的全局搜索导致效率低下。

1为了在滑动窗口检测器的基础上提高搜索速度,选择性搜索方法(selective search method)孕育而出,基于这一想法采用子区域合并的方式进行候选区域的提取 从而确定目标。 有助于确定目标之间的关系,以及目标在图像中的上下文。应用包括人脸识别、车牌识别和卫星图像分析。例如,零售和时尚等行业在基于图像的搜索中使用了图像分割。自动驾驶汽车用它来了解周围的环境


目标检测和人脸检测

这些应用包括识别数字图像中特定类的目标实例。语义对象可以分类成类,如人脸、汽车、建筑物或猫。

人脸检测 - 一种用于许多应用的目标检测,包括数字相机的生物识别和自动对焦功能。算法检测和验证面部特征的存在。例如,眼睛在灰度图像中显示为谷地。

医学影像 - 从医学影像中提取临床相关信息。例如,放射学家可以使用机器学习来增强分析,通过将图像分割成不同的器官、组织类型或疾病症状。这可以减少运行诊断测试所需的时间。

随着技术的普及,各家企业的框架逐渐成熟化,图像分割技术的门槛会越来越低。但是由于实际业务的不断丰富和深入,开源框架和工具也已经无法直接满足实际生产和业务需求。

标签:综述,检测,深度,目标,算法,搜索,图像,人脸,识别
From: https://blog.51cto.com/u_15279692/5945557

相关文章

  • 目标检测与分割领域的经典算法解读
    计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。图像目标检测又是计算机视觉的关键任务,主要对图像或视频中的物体进行识别和定位,是AI后续应用的基础......
  • 【深度学习】DNN房价预测
    前言我们使用深度学习网络实现波士顿房价预测,深度学习的目的就是寻找一个合适的函数输出我们想要的结果。深度学习实际上是机器学习领域中一个研究方向,深度学习的目标是让机......
  • 温州大学《深度学习》课程课件(十一、序列模型)
    这学期我上的另一门课是本科生的《深度学习》,主要用的是吴恩达老师的《深度学习》视频课的内容。使用教材:吴恩达《深度学习》课程笔记课外参考书:《深度学习》,人民邮电出版社......
  • 算法第一章归纳总结
    算法的四个性质:输入:有零个或者多个输入输出:至少有一个输出确定行:组成算法的每条指令清晰、无歧义有限性:算法中每条指令的执行次数有限。执行每条指令的时间也有限......
  • 图像处理——双三次插值算法
    参考论文:[1]李英民.图像双三次插值算法的研究[D].兰州大学,2020.DOI:10.27204/d.cnki.glzhu.2020.000657.......
  • 支持向量机算法之鸢尾花特征分类【机器学习】
    一.前言1.1本文原理支持向量机(SVM)是一种二元分类模型。它的基本模型是在特征空间中定义最大区间的线性分类器,这使它不同于感知器;支持向量机还包括核技术,这使得它本质上是......
  • 深度学习入门No module named 'common'问题
    这⾥的“common”模块是源代码中作者⾃⼰写的,将下载的源⽂件夹“【源代码】深度学习⼊门:基于Python的理论与实现”改名为book_code,并且将sys.path.append(os.pardir)#......
  • Python算法题
    2.11斐波那契数列1、1、2、3、5、8、13.....已知一个数列:1、1、2、3、5、8、13、。。。。的规律为从3开始的每一项都等于其前两项的和,这是斐波那契数列。求满足规律的......
  • 【机器学习】李宏毅——浅谈机器学习原理+鱼与熊掌兼得的深度学习简述
    如何评判一个训练集的好坏如果我们希望得到一个训练集,并且用该训练集所训练出来的模型,在训练集上的误差和在整个数据空间上的误差相距较小,即写成如下表达式:\[L(h^{train}......
  • 104. 二叉树的最大深度
    给定一个二叉树,找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明: 叶子节点是指没有子节点的节点。示例:给定二叉树[3,9,20,null,null......