首页 > 其他分享 >[Paper Reading] MOTR: End-to-End Multiple-Object Tracking with Transformer

[Paper Reading] MOTR: End-to-End Multiple-Object Tracking with Transformer

时间:2024-05-30 23:22:32浏览次数:26  
标签:Loss Transformer Tracking End track MOTR query

MOTR: End-to-End Multiple-Object Tracking with Transformer

link
时间:22.07
机构:Megvii

TL;DR

传统MOT通过motion与appearance来建模,有复杂的后处理难以E2E。本文基于DETR设计出MOTR算法,通过引入track query来建模被追踪物体。效果上超过同期方法,TrackFormer/TransTrack。

Method

MOTR与DETR的关系

整体算法Pipeline

其中QIM(query interaction module),以及Training Loss会在下面部分展示介绍。

QIM(query interaction module)

一个后处里Module,用来增加新Track,以及杀掉断连的老Track。最左边是Transformer Decoder输出的hidden state(以det + track为query seq),根据通过FFN得到object score来判断det object是否转为track query,以及track query是否该移除seq。TAN是用来update query特征的模块,如果某个track query对应的hidden stage继续跟踪成功,那么使用该hidden stage来更新query \(q^{i}_{tr}\)得到下一帧track query \(q^{i+1}_{tr}\)。

Collective Average Loss

不同于一般的前后帧时序训练,本文是以Clip为单位,一次性训练整个视频,Loss也按照整个Clip来计算。
单帧的Loss(参考DETR,只不过有些Det query换成了Track query)

多帧的Loss平均作为最终Loss

Ablation Study

Experiment

10min, 效果怎么样?哪些分析实验有启发意义?
相比于TrackFormer与TransTrack而言,MOTR更加E2E。

精度虽然没有SOTA,但在Transformer-Based类方法效果最佳。

在另外两个测试集上达到SOTA

总结与发散

相关链接

资料查询

折叠Title FromChatGPT(提示词:XXX)

标签:Loss,Transformer,Tracking,End,track,MOTR,query
From: https://www.cnblogs.com/fariver/p/18223135

相关文章

  • 模型节点操作学习笔记(Appendix)实验1 -- Tflite int8 删除最后的Round节点 (持续更新)
    背景如下:我要删除Round节点,同时看了一下,Dequantize和Quantize也是没有必要的。所以最好一起删除。原始项目地址:PINTO0309/hand-gesture-recognition-using-onnx:ThisisahandgesturerecognitionprogramthatreplacestheentireMediaPipeprocesswithONNX.Simultane......
  • Large Language Models as Data Augmenters for Cold-Start Item Recommendation论文
    LargeLanguageModelsasDataAugmentersforCold-StartItemRecommendation论文阅读笔记Abstract​ LLM的推理和泛化能力可以帮助我们更好地理解用户的偏好和项目特征。我们建议利用LLM作为数据增强器,来弥补在训练过程中对冷启动项目的知识差距。我们使用LLM根据用户历史行......
  • [Bash] Calendar and Dates
    CalendarcalMay2024SuMoTuWeThFrSa12345678910111213141516171819202122232425262728293031#allmonthscal2024#first6linescal2024|head-n6#showonemonthc......
  • 三十二、openlayers官网示例解析Draw lines rendered with WebGL——使用WebGL动态修
     官网demo地址:DrawlinesrenderedwithWebGL这个示例展示了如何用webgl渲染矢量图形并动态修改点、线属性。首先先把基本的地图加载上去initMap(){this.map=newMap({layers:[newTileLayer({source:newXYZ({......
  • 通过send函数发送10GB的数据,epoll
    在处理大量数据发送时,如尝试通过send函数发送10GB的数据,由于TCPsocket缓冲区大小限制,单次send调用可能并不会完全发送所有数据。例如,首次调用可能仅成功发送约256KB的数据,之后再次调用send可能会因为缓冲区已满而立即返回错误码EAGAIN,这表明必须等待缓冲区有更多空间才能继续发......
  • 【IEEE独立出版,浙江工业大学主办 | CISAT往届均已完成见刊EI Compendex,Scopus检索,会议
    2024年计算机应用与计算机图形学国际学术会议(CACG2024)将于2024年7月12-14日在中国·杭州召开,该会议作为第七届计算机信息科学与应用技术国际学术会议(CISAT2024)分会场召开。会议由浙江工业大学主办、浙江工业大学计算机科学与技术学院承办。会议旨在为从事计算机应用与计算机......
  • Personalized Prompt for Sequential Recommendation论文阅读笔记
    PersonalizedPromptforSequentialRecommendation论文阅读笔记Abstract​ 由于推荐的标记(即项目)是百万级的,没有具体的可解释语义,推荐中的序列建模应该是个性化的,因此将NLP的提示调整到推荐中的序列调整是具有挑战性的。​ 在这项工作中,我们首先介绍了提示推荐模型,并提出了一......
  • End-to-End Object Detection with Transformers
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!Europeanconferenceoncomputervision,2020 Abstract. 我们提出了一种新的方法,将目标检测视为一个直接集预测问题。我们的方法简化了检测流程,有效地消除了对许多手工设计的组件的需求,如非最大值抑制程序或锚生成,这些......
  • EndNote里参考文献的期刊名显示错误怎么办?
      本文介绍EndNote文献管理软件导入文献引用时,期刊名称带有%J前缀从而不能正常显示的解决方法。  前期的文章中,我们多次介绍了文献管理软件EndNote的具体使用方法与技巧。而在使用EndNote软件时,我们经常下载.enw等格式的文献数据库导入文件,从而在EndNote软件中导入我们的参考......
  • DependencyCheck漏洞扫描工具使用
    一、简介Dependency-Check是OWASP(OpenWebApplicationSecurityProject)的一个实用开源程序,用于识别项目依赖项并检查是否存在任何已知的,公开披露的漏洞。目前,已支持Java、.NET、Ruby、Node.js、Python等语言编写的程序,并为C/C++构建系统(autoconf和cmake)提供了有限的支持。而......