首页 > 其他分享 >RetinaNet 论文总结

RetinaNet 论文总结

时间:2024-08-07 21:25:31浏览次数:14  
标签:总结 Loss RetinaNet 检测器 论文 Cross 损失 Entropy Focal

日期:2024年08月05日

目录

前言

论文摘要

Focal Loss

Cross Entropy Loss

Balanced Cross Entropy

 Focal Loss

RetinaNet

网络架构

ResNet 

Feature Pyramid Network (FPN)

Class Subnet

Box Subnet


前言

一般来说,one-stage的目标检测器在检测速度上有着明显优势,而two-stage的目标检测器的精确度比较高。但是RetinaNet的创造者们通过利用一种在cross entropy loss的基础上改进过的损失函数代替传统的损失函数,这使得一个one-stage的模型有了更高的速度和精确度。

论文标题:Focal Loss for Dense Object Detection
论文链接:[1708.02002] Focal Loss for Dense Object Detection (arxiv.org)

论文摘要

 “目前最高准确度的目标检测器基于一种由R-CNN推广的两阶段方法,在稀疏的一组候选目标位置上应用分类器。相比之下,一阶段检测器应用于可能目标位置的规则、密集采样,尽管有潜力更快、更简单,但在准确性上一直落后于两阶段检测器。在本文中,我们调查了为什么会出现这种情况。我们发现,密集检测器在训练过程中遇到的极端前景-背景类别不平衡是主要原因。我们提出通过重塑标准的交叉熵损失来解决这种类别不平衡问题,从而降低对已分类良好的样本的损失权重。我们的新颖损失函数Focal Loss将训练集中于一小部分难样本,并防止大量简单负样本在训练过程中压倒检测器。为了评估这种损失函数的有效性,我们设计并训练了一个简单的密集检测器,称为RetinaNet。结果表明,使用Focal Loss训练的RetinaNet能够在速度上与现有的一阶段检测器匹敌,同时在准确性上超越所有现有的最先进的两阶段检测器。代码见:https://github.com/facebookresearch/Detectron。

Focal Loss

Focal Loss 是这篇论文的核心,要理解 Focal Loss 应该先了解交叉熵损失。

Cross Entropy Loss

在上式中,y yy 的取值有 1 和 -1 两种,代表前景和背景。p pp 的取值范围是 [0,1],是模型预测的属于前景的概率,为了表示方便,定义一个Pt

 综合(1)(2)两个式子就可以得到:

 

 在类别不平衡的数据集上,交叉熵损失可能会导致模型偏向于预测多数类。这是因为损失函数没有考虑类别的不平衡问题,导致模型在多数类上的损失较小,而在少数类上的损失较大。

Balanced Cross Entropy

Balanced Cross Entropy在Cross Entropy Loss的基础上引入了一个权重因子α ∈ [ 0 , 1 ],当类标签是 1 时,权重因子是 α,当类标签是 -1 时,权重因子是 1 - α。

下面是Balanced Cross Entropy Function的表达式:

Focal Loss

对于很多损失函数,容易分类的负样本占损失的大部分,并主导梯度。所以作者重塑了交叉熵损失函数,以降低简单实例的权重,更加专注于困难的样本的训练。

下面是Focal Loss Function的表达式:

下面是原文中介绍的Focal Loss的两个特性:

(1)当一个样本被错误分类且 pt 很小时,调制因子接近1,损失几乎不受影响。当 pt 趋近于1时,调制因子趋近于0,已正确分类样本的损失会被降低。

(2) 调整参数 γ 平滑地调整了容易样本被降低权重的速率。当 γ = 0 时,Focal Loss 等同于交叉熵损失(Cross-Entropy Loss);随着 γ 增加,调制因子的作用也相应增强(在我们的实验中发现 γ = 2 效果最佳)。

RetinaNet

网络架构

下图是RetinaNet的plantUML图,backbone是ResNet50

 

ResNet 

输入图像: 输入的图像通过ResNet主干网络进行处理,生成不同层级的特征图。这些特征图从浅层到深层逐渐抽象,包含了不同尺度和语义信息。

Feature Pyramid Network (FPN)

特征金字塔网络: FPN在ResNet的不同层级特征图上构建金字塔结构,通过自底向上的路径逐层上采样,并与上层特征融合。这样每个层级的特征图都包含了来自多个尺度的信息。

Class Subnet

分类子网络: 每个FPN层级的特征图都通过分类子网络进行处理。分类子网络由4个卷积层组成,每个卷积层包含256个通道,最后一个卷积层输出的通道数为 K 其中 K 是类别数量,A 是每个特征图位置上的锚框数量。

Box Subnet

回归子网络: 每个FPN层级的特征图也通过回归子网络进行处理。回归子网络的结构与分类子网络类似,由4个卷积层组成,每个卷积层包含256个通道,最后一个卷积层输出的通道数为 4A ,用于预测锚框的偏移量。

标签:总结,Loss,RetinaNet,检测器,论文,Cross,损失,Entropy,Focal
From: https://blog.csdn.net/2301_80740635/article/details/140931773

相关文章

  • 大语言模型评测方法全面总结!
    自2017年Transformer模型提出以来,自然语言处理研究逐步转向基于该框架的预训练模型,如BERT、GPT、BART和T5等。这些预训练模型与下游任务适配后,持续刷新最优结果。然而,现有评测方法存在广度和深度不足、数据偏差、忽视模型其他能力或属性评估等问题。因此,需要全面评测和深入......
  • uniapp-实现轮播图效果深度总结【建议收藏】
       ......
  • Studying-代码随想录训练营day62| Floyd 算法精讲、A*算法精讲(A star算法)、最短路算法
    第62天,完结撒花*★,°*:.☆( ̄▽ ̄)/$:*.°★*,最后的两个算法学习,编程语言C++目录Floyd算法精讲A*算法精讲(Astar算法) A*算法 复杂度分析 A*算法的缺点最短路算法总结篇 图论总结深搜和广搜并查集最小生成树 拓扑排序 最短路算法 总结 Floyd算法精讲......
  • 链表的使用和总结
    一:基本知识2:特点:内存不连续,通过指针链接解决:长度固定的问题,插入删除麻烦的问题逻辑结构:线性结构存储结构:链式存储操作:增删改查二:单向链表结构体:structnode_t{ intdata;//数据域 structnode_t*next;//指针域};2.1.1分类1>有头单向链表存在一个头节点,数据......
  • 再探GraphRAG:如何提升LLM总结能力?
    作者:王振亚编者语:自微软发布GraphRAG之后,相关解读文层出不穷,其中不乏优秀的内容。比如前段时间转载薛明同学的《微软GraphRAG框架源码解读》让大家对GraphRAG的开源代码有了快速的认识。这次我们分享一下来自蚂蚁技术同学王振亚的对GraphRAG如何提升LLM总结能力的思考,作者对Gr......
  • "AI教母"李飞飞相关论文汇总推荐
    OpenSNN开思通智网,官网地址:https://w3.opensnn.com/2024年8月份"O站创作者招募计划"快来O站写文章,千元大奖等你来拿!“一起来O站,玩转AGI!”ImageNet:ALarge-ScaleHierarchicalImageDatabase论文链接:stanford.edu简介: 互联网上图像数据的爆炸式增长有可能催生出更复......
  • Java 自定义注解笔记总结(油管)
    Java系列文章目录Java抽象相关知识笔记文章目录Java系列文章目录一、前言二、学习内容:三、问题描述四、解决方案:4.1自定义注解引入4.2自定义注解使用4.2.1自定义注解概念4.2.2自定义注解内部的属性五、总结:5.1学习总结:一、前言目的:学习自定义注解相关内......
  • python+flask计算机毕业设计智慧养老系统(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的快速发展和人口老龄化的加剧,智慧养老成为了社会关注的焦点。传统的养老模式已难以满足老年人日益增长的多元化需求,而智慧养老系......
  • python+flask计算机毕业设计新冠疫情后病历管理系统(程序+开题+论文)
    志羽·羽场管理与智能推荐系统2220o本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景新冠疫情的爆发对全球医疗体系产生了深远影响,特别是在病历管理方面。传统的病历管理方式在面对大规模......
  • python+flask计算机毕业设计微信小程序“班级小管家”(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着信息技术的迅猛发展和移动互联网的普及,微信小程序作为一种轻量级的应用程序,凭借其无需下载、即用即走的特性,在教育领域展现出了巨大的......