首页 > 其他分享 >阅读论文(7)Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks

阅读论文(7)Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks

时间:2023-02-14 09:12:21浏览次数:61  
标签:Real Towards Faster Fast 候选框 bbox CNN RPN

arXiv:1506.01497

参考:

FasterRCNN_哔哩哔哩_bilibili

初读

目前已经了解了目标检测最基础的3个算法:R-CNN、SSPNet和Fast R-CNN,后两者都是基于R-CNN的优化,所以说R-CNN是深度学习目标检测的开山之作。

R-CNN存在不足之处,1张图片使用SS(Selective Search)算法生成的2k个候选框分别输入CNN提取特征值,时间开销太大,且要求固定图片输入尺寸,后两者对于R-CNN的优化之处在于

  • SPPNet

    只对原始图片进行1次卷积,将候选框映射到特征图上,再进行后续处理

    提出SPP layer,可以处理任意大小的图片

  • Fast R-CNN

    将提取特征值、分类、bbox整合,形成单阶段模型

    简化SSP layer,提出RoI pooling layer

    在分类和bbox 回归时使用全连接网络,而不是之前的SVMs

3个模型共同之处时他们的第1步都是使用SS算法生成候选框,论文提出这个操作是整个模型的瓶颈,提出了RPN(Region Proposal Network),可以实现几乎没有时间开销的情况下生成高质量的候选框。将RPN技术和Fast R-CNN结合提出了Faster R-CNN模型,实现实时(Real-Time)目标检测算法。

image-20230212113409681

提出RPN是论文主要的贡献,另外还有一些细节贡献

  • 提出了anchor boxs(锚框)的概念
  • RPN和Fast R-CNN共享卷积层
  • 将候选框的选取和后面的特征提取、分类和bbox回归组成一个统一整体
image-20230212113836614

摘要中提到了注意力机制(attention mechanisms),还不了解

再读

Faster R-CNN的整体架构如下图所示

image-20230212104535893

RPN部分具体结构如下图所示

image-20230212104729814

整体架构,实现了端到端(end-to-end),将候选框的选取也作为网络的一部分

image-20230214085553759

标签:Real,Towards,Faster,Fast,候选框,bbox,CNN,RPN
From: https://www.cnblogs.com/dctwan/p/17118529.html

相关文章

  • 《Towards Cooperation in Sequential Prisoner’s Dilemmas: a Deep Multiagent Rein
    致力于序贯囚徒困境中的合作:一种多智能体深度强化学习的方法总结主要是针对复杂的序贯囚徒困境的合作提出的方法,目的是为了提高合作程度最终达到提高社会总收益的。该方......
  • Smart cities need real-time data
    Manycitiescouldbenefitinnewwaysfromreal-timestreamsofinformationontheirstreetsandbuildings.Forexample,duringtheCovidcrisis,analystsint......
  • malloc、calloc和realloc的区别
    1.malloc函数使用方法:参数是所需申请的内存块的字节数,返回指向申请的内存块的首地址的无类型指针,malloc申请的内存块是未初始化的。函数原型:void*malloc(size_tnum_s......
  • YOLO V2 :Better、Faster、Stronger
    BetterBatchNormalization(BN层)​ Yolov2中在每个卷积层后都加了BN层,去掉了dropout层。BN层可以起到一定的正则化效果,能提升模型收敛速度,防止模型过拟合。通过BN......
  • shiro-realm授权过虑器
    使用PermissionsAuthorizationFilter在applicationContext-shiro.xml中配置url所对应的权限测试流程:1、在applicationContext-shiro.xml中配置filter规则<!--商品查询需要......
  • Note for Real Analysis (Stein)
    CopiedfromRealAnalysis(Stein).Tomakeiteasiertorememberwhattheauthorsaidpreviouslywhilelearning.目录1MeasureTheory1PreliminariesOpen,clo......
  • vulnhub靶场之CEREAL: 1
    准备:攻击机:虚拟机kali、本机win10。靶机:Cereal:1,下载地址:https://download.vulnhub.com/cereal/Cereal.ova,下载后直接vbox打开即可。知识点:/etc/passwd文件提权、dns解......
  • 论文翻译:2022_PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech En
    博客地址:凌逆战(转载请注明出处) 论文地址:PercepNet+:用于实时语音增强的相位和信噪比感知PercepNet引用格式: GeX,HanJ,LongY,etal.PercepNet+:APhasea......
  • c分配内存底层函数 realloc
    realloc(void*__ptr,size_t__size):更改已经配置的内存空间,即更改由malloc()函数分配的内存空间的大小。如果将分配的内存减少,realloc仅仅是改变索引的信息。如果是将......
  • Unreal学习笔记2-绘制简单三角形
    目录1.概述2.详论2.1.代码实现2.2.解析:Component2.3.解析:材质2.4.解析:包围盒2.5.解析:Section3.其他4.参考1.概述之所以写这个绘制简单三角形的实例其实是想知......