原文标题:YOLOX: Exceeding YOLO Series in 2021
中文标题:YOLOX:2021年超越YOLO系列
代码地址: https://github.com/Megvii-BaseDetection/YOLOX
Abstract
在本报告中,旷视团队介绍了对YOLO系列的一些经验丰富的改进,形成了一种新的高性能检测器——YOLOX。我们将 YOLO 检测器切换为无锚模式,并采用其他先进的检测技术,即解耦头和先进的标签分配策略 SimOTA,以在大规模模型范围内实现最先进的结果:对于 YOLONano 仅用 0.91M 参数和 1.08G FLOPs,在 COCO 上获得了 25.3% 的 AP,超过 NanoDet 1.8% AP; 对于业界最广泛使用的检测器之一 YOLOv3,在 COCO 上将其 AP 提升至 47.3%,比当前最佳实践高出 3.0% AP; 对于参数量与YOLOv4CSP、YOLOv5-L大致相同的YOLOX-L,在Tesla V100上以68.9 FPS的速度在COCO上实现了50.0%的AP,比YOLOv5-L高了1.8%的AP。此外,旷视团队使用单个 YOLOX-L 模型赢得了流感知挑战(CVPR 2021 自动驾驶研讨会)第一名。
1、Introduction
随着目标检测技术的发展,YOLO系列一直在实时应用中追求速度和精度的最佳权衡。他们提取了当时可用的最先进的检测技术(例如,YOLOv2的锚点,YOLOv3的残留网),并优化了最佳实践的实现。目前,YOLOv5持有最佳的权衡性能,在13.7 ms.1的COCO上有48.2%的AP。然而,在过去两年中,目标检测学术界的主要进展集中在无锚点检测器、高级标签分配策略和端到端(无nms)检测器。这些还没有集成到YOLO系列中,因为YOLOv4和YOLOv5仍然是基于锚点的探测器,具有手工制作的训练分配规则。这就是我们在这里的原因,通过经验丰富的优化,为YOLO系列提供这些最新的进步。考虑到YOLOv4和YOLOv5对于基于锚点的管道可能有些过度优化,我们选择YOLOv3作为起点(我们将YOLOv3- spp设置为默认的YOLOv3)。事实上,在各种实际应用中,由于计算资源有限,软件支持不足,YOLOv3仍然是行业中应用最广泛的探测器之一。
如图1所示,随着上述技术的不断更新,我们在640 × 640分辨率的COCO上将YOLOv3的AP提高到47.3% (YOLOv3 - darknet53),大大超过了目前YOLOv3的最佳实践(44.3% AP, ultralytics version2)。此外,当切换到采用先进的CSPNet骨干网和额外的PAN头的先进YOLOv5架构时,YOLOX-L在640 × 640分辨率的COCO上达到50.0%的AP,比对应的YOLOv5- l高出1.8%的AP。我们还在小尺寸模型上测试了我们的设计策略。YOLOX-Tiny和YOLOX-Nano(仅0.91M参数和1.08G FLOPs)分别比对应的YOLOv4-Tiny和NanoDet3分别高出10%和1.8%的AP。
2、Comparison with the SOTA
不同目标检测器在COCO 2017测试开发中的速度和精度比较。为了公平比较,我们选择了在300个epoch上训练的所有模型。
3、1st Place on Streaming Perception Challenge(WAD at CVPR 2021)
我们取得了流媒体感知挑战第一名(WAD at CVPR 2021)。WAD 2021上的流感知挑战是通过最近提出的度量来对准确性和延迟进行联合评估:流精度。该指标背后的关键见解是在每个时刻联合评估整个感知堆栈的输出,迫使堆栈考虑在计算发生时应忽略的流数据量。 我们发现,30 FPS 数据流指标的最佳权衡点是推理时间≤ 33ms 的强大模型。因此,我们采用 YOLOX-L 模型和 TensorRT 来制作我们的最终模型,以迎接赢得第一名的挑战。 请参阅挑战网站了解更多详情。
4、Conclusion
在本报告中,我们介绍了 YOLO 系列的一些经验丰富的更新,形成了名为 YOLOX 的高性能无锚检测器。 配备了一些最新的先进检测技术,即解耦头、无锚点和先进的标签分配策略,YOLOX 在所有模型尺寸上比其他同类产品在速度和准确性之间实现了更好的权衡。 值得注意的是,我们将 YOLOv3 的架构提升到了 COCO 上的 47.3% AP,超过当前最佳实践 3.0% AP,由于其广泛的兼容性,YOLOv3 仍然是业界最广泛使用的检测器之一。 我们希望这份报告能够帮助开发者和研究人员在实际场景中获得更好的体验。
标签:YOLOv3,检测器,YOLO,free,YOLOX,AP,COCO,速读 From: https://blog.csdn.net/m0_63294504/article/details/144607841