（MEGA详解）Memory enhanced global-local aggregation for video object detection （CVPR2020）

时间：2024-05-13 15:22:11浏览次数：28

在视频中检测物体和在图像中检测物体的最大区别在于：信息存在于时间维度中。视频中孤立的帧可能会出现运动模糊、遮挡或失焦等问题，自然可以想到从整个视频中寻找线索来识别物体。
当我们无法确定一个目标的类别时，我们会从其它帧中寻找一个与当前目标具有高度语义相似性的独特目标，并将它们分配在一起。这种信息称为全局语义信息，因为视频中的每一帧都可以被引用。当我们无法确定一个目标是否存在时（黑暗中行走的黑猫），我们不能仅依靠语义信息来告诉我们目标位置，因为实例的存在还没在当前帧中被认可（翻译的比较僵硬，大概就是当前帧中你都不确定有这个目标，你如何根据全局语义信息来增强当前帧目标的特征呢？我得先确定有这个目标，然后这个目标可能会出现先前提到的遮挡等问题，再利用全局语义信息来增强特征），可以通过计算附近帧之间的差得到运动等信息，就能定位当前帧的目标。这种信息称为局部定位信息。人类主要通过这两种信息来识别目标。
根据上述思想，利用整个视频信息来增强VID方法，如（a）所示。整个视频信息比较冗余且庞杂，存在大量的方框，显然不可行。此时就需要平衡效率和精度了。主要分为两大类方法：全局聚合和局部聚合。在短的局部范围内同时利用语义和定位信息，或者只考虑框之间的语义信息。不幸的是，这些方法都不能同时查看局部和全局信息。
还存在一个问题是用于聚合的帧的大小，这决定了当前帧可以从中收集的信息量。大部分方法只选择20-30帧进行特征聚合（1~2秒），如（b）和（c）所示，我们认为这种规模的聚合不足以近似局部和全局影响。论文提出的MEGA能够有效地解决上述问题，有效地聚合全局和局部信息来增强当前帧的候选框特征。
第一阶段，MEGA将全局和局部信息聚合到关键帧，如（d）上半部分所示，但是可用内容仍然有限。第二阶段，引入LRM使得当前帧能够访问更多的内容（关键在于LRM的更新，它会重用之前计算得到的特征，而之前计算得到的特征又包含全局信息，不断重复之后，当前帧就能够访问到更多的内容）。

标签：object,聚合,MEGA,global,语义,信息,目标,当前,全局
From： https://www.cnblogs.com/timeac-coder/p/18189291

java.lang.IllegalArgumentException: Invalid value type for attribute 'factoryBea
简介前排提示：这个错误一般是由于Spring新版本导致的与其他框架不兼容现象，解决办法一般是升级其他框架版本。使用springboot-3.2.5和myabtis-plus-3.5.0搭建开发环境时，启动Springboot程序时报错，报错信息：点击查看代码java.lang.IllegalArgumentException:Invalidvalu......
Object.values()对象遍历
Object.keys() 对象的遍历返回给定对象所有可枚举属性的数组；是属性名组成的数组letobj={a:1,b:2,c:3};Object.keys(obj).map((key)=>{console.log(key,obj[key]);}); Object.values() 对象的遍历返回一个给定对象自身的所有属性值的......
比较 Swift 中的闭包和 Objective-C 中的 Block
在iOS开发中，闭包（Swift）和Block（Objective-C）都是用于实现匿名函数的重要概念。它们在很多方面都有相似之处，但也存在一些显著的差异。本文将从应用和原理两个层面对Swift中的闭包和Objective-C中的Block进行比较和分析。1.应用层面的比较1.1相似之处功能性相同：闭包和......
理解 Swift 中闭包与 Objective-C 中 Block 的外部变量捕获机制
在Swift中的闭包和Objective-C中的Block都支持捕获外部变量，使得在闭包或Block内部可以访问外部作用域的变量。本文将深入探讨它们在捕获外部变量方面的机制和区别。1.Swift中闭包的外部变量捕获机制在Swift中，闭包捕获外部变量时会根据情况选择采用值捕获（Captureby......
ubuntu22 python2 pyinstaller 打包报错：'NoneType' object has no attribute 'groups'
前言最近有个需求，需要在ubnutu22上使用pyinstaller打包一个python2的文件。中间遇到了一些问题：pip2installpyinstaller报错解决方案：pip2installpyinstaller==3.6python2和python3的pyinstaller如何同时存在，我想把python2的pyinstaller命名为pyin......
Error: Cannot find module ‘D:\SoftSetupLoaction\nodejs\node_global\node_mod
Error:Cannotfindmodule‘D:\SoftSetupLoaction\nodejs\node_global\node_modules\npm\bin\npm-cli.js‘ 出现原因:重新安装可装了nodejs和npm网上查了很多方法，都建议重装，但是都没有效果(因为我就是重装之后出现的问题)按照错误提示node_global找不到npm-cli.js,个......
Jenkins发版时报错Failed to instantiate [io.seata.spring.annotation.GlobalTransac
Failedtoinstantiate[io.seata.spring.annotation.GlobalTransactionScanner]:Factorymethod'globalTransactionScanner'threwexception;nestedexceptionisjava.lang.ExceptionInInitializerError一开始以为是seata配置有问题，但最近也没有动过，直接执行发版脚本就没事......
[Paper Reading] OFT Orthographic Feature Transform for Monocular 3D Object Detec
OFTOrthographicFeatureTransformforMonocular3DObjectDetectionOFTOrthographicFeatureTransformforMonocular3DObjectDetection时间：18.11机构：UniversityofCambridgeTL;DR当时纯视觉自动驾驶方案效果上仅达到Lidar方案有10%的水平，本文claim部分差距源于pe......
Tensorflow object detection API (ubuntu18.04) 安装和踩坑；
踩坑：将slim和models路径加入虚拟环境中；将slim和models路径加入系统路径中；（加入系统路径的时候，这个pwd） qit（持续更新）具体安装流程：（很多问题）2.0版本；（继续更新）condacreate-ntf_obj_det_api_v2python=3.8 (很丝滑)重新尝试tf1.0版本；参考：https://blog.csdn......
Flutter 中的 GlobalKey
前沿flutter局部刷新可以用到GlobalKeyGlobalKey是一个特殊的标识符，它用于在Widget树中唯一标识一个Widget，并允许我们在Widget树之外访问该Widget的状态或属性。它通常用于在多个Widget之间共享状态、访问子Widget的方法或属性，以及执行一些全局操作。注意：GlobalKey不应......

（MEGA详解）Memory enhanced global-local aggregation for video object detection （CVPR2020）

相关文章

赞助商

阅读排行