首页 > 其他分享 >论文速读,YOLOX:anchor free的单阶段目标检测模型

论文速读,YOLOX:anchor free的单阶段目标检测模型

时间:2024-12-20 11:59:18浏览次数:5  
标签:YOLOv3 检测器 YOLO free YOLOX AP COCO 速读

原文标题:YOLOX: Exceeding YOLO Series in 2021

中文标题:YOLOX:2021年超越YOLO系列

代码地址: https://github.com/Megvii-BaseDetection/YOLOX

Abstract

在本报告中,旷视团队介绍了对YOLO系列的一些经验丰富的改进,形成了一种新的高性能检测器——YOLOX。我们将 YOLO 检测器切换为无锚模式,并采用其他先进的检测技术,即解耦头和先进的标签分配策略 SimOTA,以在大规模模型范围内实现最先进的结果:对于 YOLONano 仅用 0.91M 参数和 1.08G FLOPs,在 COCO 上获得了 25.3% 的 AP,超过 NanoDet 1.8% AP; 对于业界最广泛使用的检测器之一 YOLOv3,在 COCO 上将其 AP 提升至 47.3%,比当前最佳实践高出 3.0% AP; 对于参数量与YOLOv4CSP、YOLOv5-L大致相同的YOLOX-L,在Tesla V100上以68.9 FPS的速度在COCO上实现了50.0%的AP,比YOLOv5-L高了1.8%的AP。此外,旷视团队使用单个 YOLOX-L 模型赢得了流感知挑战(CVPR 2021 自动驾驶研讨会)第一名。

1Introduction

随着目标检测技术的发展,YOLO系列一直在实时应用中追求速度和精度的最佳权衡。他们提取了当时可用的最先进的检测技术(例如,YOLOv2的锚点,YOLOv3的残留网),并优化了最佳实践的实现。目前,YOLOv5持有最佳的权衡性能,在13.7 ms.1的COCO上有48.2%的AP。然而,在过去两年中,目标检测学术界的主要进展集中在无锚点检测器、高级标签分配策略和端到端(无nms)检测器。这些还没有集成到YOLO系列中,因为YOLOv4和YOLOv5仍然是基于锚点的探测器,具有手工制作的训练分配规则。这就是我们在这里的原因,通过经验丰富的优化,为YOLO系列提供这些最新的进步。考虑到YOLOv4和YOLOv5对于基于锚点的管道可能有些过度优化,我们选择YOLOv3作为起点(我们将YOLOv3- spp设置为默认的YOLOv3)。事实上,在各种实际应用中,由于计算资源有限,软件支持不足,YOLOv3仍然是行业中应用最广泛的探测器之一。

如图1所示,随着上述技术的不断更新,我们在640 × 640分辨率的COCO上将YOLOv3的AP提高到47.3% (YOLOv3 - darknet53),大大超过了目前YOLOv3的最佳实践(44.3% AP, ultralytics version2)。此外,当切换到采用先进的CSPNet骨干网和额外的PAN头的先进YOLOv5架构时,YOLOX-L在640 × 640分辨率的COCO上达到50.0%的AP,比对应的YOLOv5- l高出1.8%的AP。我们还在小尺寸模型上测试了我们的设计策略。YOLOX-Tiny和YOLOX-Nano(仅0.91M参数和1.08G FLOPs)分别比对应的YOLOv4-Tiny和NanoDet3分别高出10%和1.8%的AP。

2、Comparison with the SOTA

不同目标检测器在COCO 2017测试开发中的速度和精度比较。为了公平比较,我们选择了在300个epoch上训练的所有模型。

3、1st Place on Streaming Perception Challenge(WAD at CVPR 2021)

我们取得了流媒体感知挑战第一名(WAD at CVPR 2021)。WAD 2021上的流感知挑战是通过最近提出的度量来对准确性和延迟进行联合评估:流精度。该指标背后的关键见解是在每个时刻联合评估整个感知堆栈的输出,迫使堆栈考虑在计算发生时应忽略的流数据量。 我们发现,30 FPS 数据流指标的最佳权衡点是推理时间≤ 33ms 的强大模型。因此,我们采用 YOLOX-L 模型和 TensorRT 来制作我们的最终模型,以迎接赢得第一名的挑战。 请参阅挑战网站了解更多详情。

4、Conclusion

在本报告中,我们介绍了 YOLO 系列的一些经验丰富的更新,形成了名为 YOLOX 的高性能无锚检测器。 配备了一些最新的先进检测技术,即解耦头、无锚点和先进的标签分配策略,YOLOX 在所有模型尺寸上比其他同类产品在速度和准确性之间实现了更好的权衡。 值得注意的是,我们将 YOLOv3 的架构提升到了 COCO 上的 47.3% AP,超过当前最佳实践 3.0% AP,由于其广泛的兼容性,YOLOv3 仍然是业界最广泛使用的检测器之一。 我们希望这份报告能够帮助开发者和研究人员在实际场景中获得更好的体验。

标签:YOLOv3,检测器,YOLO,free,YOLOX,AP,COCO,速读
From: https://blog.csdn.net/m0_63294504/article/details/144607841

相关文章

  • freeswitch集成tts和asr
    LUA脚本实现语音的对话并记录在数据库--引入LuaSQLMySQL模块localluasql=require"luasql.mysql"--数据库连接设置DBHOST='127.0.0.1'--MySQL服务器地址DBNAME='freeswitch'--这里使用你实际的数据库名称DBUSER='root'--MySQL数据库用户名......
  • Freemarker--学习笔记
    目录前言二、Freemarker数据类型1.布尔类型2.日期类型3.数值类型4.字符串类型5.sequence类型6.序列类型(数组、List、Set)6.1数组6.2集合6.1hash三、Freemarker常见指令1.assign自定义变量指令2.ifelseifelse逻辑判断指令3.list遍历指令4.macro自定义指......
  • NLP论文速读(MetaMetrics)|使用人类偏好校准生成任务的度量
    论文速读|METAMETRICS:CALIBRATINGMETRICSFORGENERATIONTASKSUSINGHUMANPREFERENCES论文信息:简介:    本文探讨了在自然语言处理(NLP)和其他生成任务中,如何评估模型输出的质量以确保其与人类偏好一致。传统的评估指标(如BLEU分数)往往不能全面捕捉语言的多样......
  • AI问答之FreeRTOS
    一、freertos源码中task.c文件如此大,里面都写了什么?FreeRTOS的 task.c 文件是FreeRTOS内核的核心实现文件之一,包含了任务管理、调度、时间管理等关键功能的实现。由于FreeRTOS是一个功能丰富的实时操作系统(RTOS),task.c 文件的代码量较大,通常在数千行左右。以下是 task.c......
  • freeswitch(开启支持MCU视频会议,使用mod_av模块)
    亲测版本centos7.9系统–》freeswitch1.10.9本人freeswitch安装路径(根据自己的路径进入)/usr/local/freeswitch/etc/freeswitch场景说明:有些场景想使用视频会议MCU融合画面进行开会使用方法:第一步:下载插件yuminstall-yepel-releaseyuminstall......
  • FreeRTOS-(2)-队列
    一、什么是队列?    队列又称消息队列,是一种常用于任务间通信的数据结构,队列可以在任务与任务间、中断和任务间传递信息。    为什么不使用全局变量?    如果使用全局变量,任务1 修改了变量a,等待任务3处理,但任务3处理速度很慢,在......
  • 腾讯优图最新开源Freeze-Omini:冻结LLM引入语音处理能力
    作者:yearn原文:https://zhuanlan.zhihu.com/p/8242564370 近年来大语言模型(LLM)的快速发展为智能应用带来了巨大机会,而语音作为自然的人机交互形式,其与LLM的结合可以显著提升用户体验。然而,传统的语音交互方式通过ASR+LLM+TTS的级联方式实现,存在高工程复杂性和较大交......
  • Freertos低功耗-Tickless模式
    此篇文章在2023年5月15日被记录很多嵌入式设备都对功耗有严格的控制,特别是消费电子对功耗的控制更为严格,Tickless是freertos中的一个可选模块,主要实现低功耗功能STM32类芯片的低功耗模式STM32之类的arm芯片通常有三种低功耗模式:睡眠模式(sleep):仅CPU时钟关闭,其他所有外......
  • Freertos-CPU使用率统计
    此篇文章在2023年5月23日被记录RTOS-任务CPU占用统计在项目开发过程中,有时会需要查看各个任务的资源占用,需要用到rtos的CPU使用统计,其原理也很简单,就是开一个频率特别高的定时器,rtos在运行过程累计各个任务的实际占用时长,继而统计显示FreeRTOSConfig配置//计算CPU使用率#......
  • FreeSWITCH外呼系统是什么?
    FreeSWITCH外呼系统是什么?作者:开源呼叫中心系统FreeIPCC作者介绍:致力于成为大模型呼叫中心系统、电话机器人、客服机器人、智能呼叫中心系统、大模型智能客服系统;开源呼叫中心系统、开源客服系统;视频呼叫中心系统、视频客服系统;全渠道客服系统、在线客服系统等客户服务、企业......