首页 > 其他分享 >YOLO9000 架构 – 更快、更强大

YOLO9000 架构 – 更快、更强大

时间:2025-01-15 18:58:05浏览次数:3  
标签:WordTree mAP 强大 架构 YOLO 9000 COCO YOLO9000

YOLO v2 和 YOLO 9000 由 J. Redmon 和 A. Farhadi 于 2016 年在题为“YOLO 9000:更好、更快、更强”的论文中提出。在 67 FPS 时,YOLOv2 的 mAP 为 76.8%,在 67 FPS 时,它在 VOC 2007 数据集上的mAP 为78.6%,优于更快的 R-CNN 和 SSD 等模型。YOLO 9000 使用 YOLO v2 架构,但能够检测到 9000 多个类。然而,YOLO 9000 的 mAP 为 19.7% mAP,其中 16% mAP 在非 COCO 的 156 类上。但是,YOLO 可以预测 9000 多个类。

建筑:
 

Darknet-19 架构

Darknet-19 架构

YOLO9000 的架构与 YOLOv2 的架构非常相似。它还使用 Darknet-19 架构作为其深度神经网络 (DNN) 架构。但是,它们的分类架构之间的主要区别。让我们看看下面的 YOLO 9000 分类架构:

分类任务:
对象检测数据集(COCO:80 个类)的类比分类(ImageNet:22k 类)少得多。扩展 YOLO 可以检测的类。本文提出了一种将分类检测任务与检测任务合并的方法。它使用端到端网络进行训练,同时反向传播分类损失。但是,检测和分类的所有类的简单合并问题并不是简单地相互排斥的。例如,在 COCO 数据集中,类标签是 Cat、Dog 等通用类,但在 Imagenet 中也有特定的类(例如,对于 Dog,我们有类 Norfolk terrier“、”Yorkshire terrier“或”Bedlington terrier”)。我们不能为 “Dog” 和 “Norfolk terrier” 设置不同的 softmax 类,因为它们并不互斥。
 

我们不能直接组合,因为这些类不是互斥的

分层分类:
YOLO9000提出了一种称为分层分类的方法。在这种方法中。他们提出了一种基于树的分层结构,在我们进行分类时表示类及其子类。例如,诺福克梗属于“梗”,而“梗”又属于“狗”类。此结构的灵感来自 WordNet。但是,它没有使用图形结构,而是使用基于 Imagenet 数据集中图像集合概念的分层树结构)。这种层次结构称为 WordTree。
 

WordTree 示例

为了执行分类,此 WordTree 在每个节点级别使用条件概率。要计算叶节点(特定类)的条件概率,我们需要将其所有父节点的条件概率相乘。此体系结构将 “Physical object” 定义为其根节点认为 Pr(物理对象) =1。
例如,不同类型梗的条件概率可以计算为:
 

现在,我们可以获得该对象属于 “Norfolk Terrier” 类的绝对概率。

 

本文以 ImageNet-1000 为例进行实验。我们没有创建一个 1000 层的平面结构,而是创建了一个类似 WordTree 的分层树结构,具有 1000 个叶节点和 369 个父节点。
 

ImageNet 与 WordTree

简单的 1k Imagenet 与 WordTree

使用与 YOLOv2 中相同的训练参数,Imagenet 上的这个分层 Darknet-19 实现了 71.9% 的 top-1 准确率和 90.4% top-5 的准确率。分层分类的优势在于,当此模型无法区分叶类时,它会给父类带来很高的概率。

训练:
该模型使用 WordTree 方法将 COCO 类与 Imagenet 的前 9000 个类标签相结合,得到一个 9418 节点的 WordTree。因此,相应的 WordTree 有 9418 个类。Imagenet 是一个比 COCO 大得多的数据集。为了平衡数据集,我们对 COCO 进行了过度采样,使 Imagenet 和 COCO 样本之间的比率为 4:1。
我们使用 YOLOv2 数据集训练模型,但我们只使用 3 个锚框而不是 5 个。当此网络输入检测图像时,这会正常反向传播检测丢失,但对于分类丢失,它会在标签的相应级别或更高级别反向传播丢失。

结果和结论:
YOLO9000 的总体 mAP 为 19.7%,检测数据集中不存在的类的 mAP 为 16%。它在 COCO 数据集中不存在的新动物物种上也表现得更好。mAP 高于 DPM 模型中产生的 mAP。
YOLO9000 的主要优点是它能够实时预测 9000 多个类(准确地说是 9418 个)。
 

YOLO 9000 结果

YOLO 9000 结果

因为它具有大量的类预测能力。它是从医学成像到无人机监控、制造业等应用最广泛的物体识别架构之一。

参考: 

标签:WordTree,mAP,强大,架构,YOLO,9000,COCO,YOLO9000
From: https://blog.csdn.net/jianqimingtian/article/details/145074984

相关文章

  • GaussDB技术解读——GaussDB架构介绍之数据持久化存取层(DataNode)关键技术方案
    数据持久化存取层(DataNode)关键技术方案Datanode节点主要负责数据的持久化和快速写入、读取。数据持久化采用物理日志wal,事务提交wal刷盘,对外提供逻辑日志功能,反解析物理日志为SQL逻辑日志。图1datanode数据持久化Astore:存储格式为追加写优化设计,其多版本元组采用新、老版......
  • GaussDB技术解读——GaussDB架构介绍之全局事务管理层(GTM)关键技术方案
    GTM仅处理全局时间戳请求,64位CSN递增,几乎都是CPU++和消息收发操作。不是每次都写ETCD,而是采用定期持久化到ETCD里,每次写ETCD的CSN要加上一个backup_step(100w),一旦GTM故障,CSN从ETCD读取出来的值保证单调递增。当前GTM只完成CSN++,预估可以支持200M/s请求。GTM处理......
  • GaussDB技术解读——GaussDB架构介绍之集群管理层(CM)关键技术方案
    GaussDBKernelV5集群管理层关键模块如下。图4集群管理层组件设计图CM组件提供了四种服务CMAgent,CMServer,OMMonitor,cm_ctl,与各类实例服务组件(CN,DN,GTM等)一起构成了整个数据库集群系统。cm_ctl通过命令行执行集群的启动、停止、状态查询、主备倒换、备机重......
  • GaussDB技术解读——GaussDB架构介绍之OM运维管理关键技术方案
    ​GaussDBKernelV5OM运维管理关键模块如下。OM运维主要功能有:安装升级节点替换扩容、缩容自动告警巡检备份恢复、容灾日志分析系统在华为云的部署模式下,OM相关组件部署示意图如下:图7华为云OM运维管理用户登录华为云Console,访问GaussDBKernelV5的管控页面,输入......
  • 【PCIE734-1 】基于 PCIe 总线架构的 XCKU060 FPGA 4 路 SFP+光纤通道处理平台
    产品概述PCIE734-1 是一款基于 PCIE 总线架构的 KintexUltraScale 系列 XCKU060FPGA 高性能 4 路 SFP+光纤数据处理平台。该平台具有 1 个 PCIeGen3x8 主机接口、4 个 SFP+10G 光纤接口,可以实现 4 路 SFP+10G 光纤的数据实时采集、处理、传输。板 卡......
  • 【VPX303】基于 3U VPX 总线架构的双银河飞腾 FT-M6678 DSP 信号处理平台(100%全国产化
    ​产品概述VPX303是一款基于3UVPX总线架构的高性能信号处理板,板载2片国防科大银河飞腾FT-M6678多核浮点运算DSP,可以实现各种实时性要求较高的信号处理算法。板卡每个DSP均支持5片DDR3SDRAM实现数据缓存,两片DSP之间通过X4SRIO进行互联。每个DSP均引出1路......
  • No Magic - 复杂产品系统架构开发套件
    概述      NoMagic系列产品被达索收购后融入3DExperience产品协同研发管理平台中,是一款强大的建模工具,专为软件分析和设计、系统建模、项目管理等领域设计。该软件提供对SysML/UML/UAF语言的完整支持,提供MagicGrid方法论,涵盖:业务分析、干系人需求分析、系统需求定义......
  • Autopy 是一款基于 Python 和 Rust 的强大 GUI 自动化库
    Autopy是一款基于Python和Rust的强大GUI自动化库,它为开发者提供了简便且高效的API来模拟鼠标和键盘的操作、在屏幕上查找颜色和位图以及显示警报。这些功能使得Autopy成为了一个跨平台的自动化工具,适用于MacOSX、Windows以及支持XTest扩展的X11系统。跨......
  • 云手机技术架构原理浅析,ARM架构与X86架构的对比
    云手机与真实手机的最大区别在于,云手机是架构在服务器上的虚拟手机,只要服务器不断电且连接了网络,云手机就可以持续挂机运行,而真机需要受到手机硬件本身的限制。目前主流的云手机技术主要分为几种架构:ARM技术架构、X86架构和真机架构等,下面主要给大家介绍ARM架构和X86架构两种之......
  • 一文搞懂架构设计的衡量标准:功能性、可用性、性能、可扩展性、安全性、协作效率、复杂
    大家好,我是汤师爷~架构设计的首要目标是服务于业务需求。因此,我们不应该盲目追求所谓的"最厉害的"架构,而应该致力于寻找最适合当前业务环境和未来发展需求的架构方案。衡量架构的合理性是一个复杂的过程,需要从多个角度进行全面评估。主要可以从以下视角进行分析:功能需求视角:评......