[Paper Reading] MOTR: End-to-End Multiple-Object Tracking with Transformer

时间：2024-05-30 23:22:32浏览次数：26

标签：Loss Transformer Tracking End track MOTR query

MOTR: End-to-End Multiple-Object Tracking with Transformer

link
时间：22.07
机构：Megvii

TL;DR

传统MOT通过motion与appearance来建模，有复杂的后处理难以E2E。本文基于DETR设计出MOTR算法，通过引入track query来建模被追踪物体。效果上超过同期方法，TrackFormer/TransTrack。

Method

MOTR与DETR的关系

整体算法Pipeline

其中QIM(query interaction module)，以及Training Loss会在下面部分展示介绍。

QIM(query interaction module)

一个后处里Module，用来增加新Track，以及杀掉断连的老Track。最左边是Transformer Decoder输出的hidden state(以det + track为query seq)，根据通过FFN得到object score来判断det object是否转为track query，以及track query是否该移除seq。TAN是用来update query特征的模块，如果某个track query对应的hidden stage继续跟踪成功，那么使用该hidden stage来更新query \(q^{i}_{tr}\)得到下一帧track query \(q^{i+1}_{tr}\)。

Collective Average Loss

不同于一般的前后帧时序训练，本文是以Clip为单位，一次性训练整个视频，Loss也按照整个Clip来计算。
单帧的Loss（参考DETR，只不过有些Det query换成了Track query）

多帧的Loss平均作为最终Loss

Ablation Study

Experiment

10min, 效果怎么样？哪些分析实验有启发意义？
相比于TrackFormer与TransTrack而言，MOTR更加E2E。

精度虽然没有SOTA，但在Transformer-Based类方法效果最佳。

在另外两个测试集上达到SOTA

总结与发散

资料查询

折叠Title

FromChatGPT(提示词：XXX)

标签：Loss,Transformer,Tracking,End,track,MOTR,query
From： https://www.cnblogs.com/fariver/p/18223135

模型节点操作学习笔记（Appendix）实验1 -- Tflite int8 删除最后的Round节点（持续更新）
背景如下：我要删除Round节点，同时看了一下，Dequantize和Quantize也是没有必要的。所以最好一起删除。原始项目地址：PINTO0309/hand-gesture-recognition-using-onnx:ThisisahandgesturerecognitionprogramthatreplacestheentireMediaPipeprocesswithONNX.Simultane......
Large Language Models as Data Augmenters for Cold-Start Item Recommendation论文
LargeLanguageModelsasDataAugmentersforCold-StartItemRecommendation论文阅读笔记Abstract LLM的推理和泛化能力可以帮助我们更好地理解用户的偏好和项目特征。我们建议利用LLM作为数据增强器，来弥补在训练过程中对冷启动项目的知识差距。我们使用LLM根据用户历史行......
[Bash] Calendar and Dates
CalendarcalMay2024SuMoTuWeThFrSa12345678910111213141516171819202122232425262728293031#allmonthscal2024#first6linescal2024|head-n6#showonemonthc......
三十二、openlayers官网示例解析Draw lines rendered with WebGL——使用WebGL动态修
官网demo地址：DrawlinesrenderedwithWebGL这个示例展示了如何用webgl渲染矢量图形并动态修改点、线属性。首先先把基本的地图加载上去initMap(){this.map=newMap({layers:[newTileLayer({source:newXYZ({......
通过send函数发送10GB的数据，epoll
在处理大量数据发送时，如尝试通过send函数发送10GB的数据，由于TCPsocket缓冲区大小限制，单次send调用可能并不会完全发送所有数据。例如，首次调用可能仅成功发送约256KB的数据，之后再次调用send可能会因为缓冲区已满而立即返回错误码EAGAIN，这表明必须等待缓冲区有更多空间才能继续发......
【IEEE独立出版，浙江工业大学主办 | CISAT往届均已完成见刊EI Compendex，Scopus检索，会议
2024年计算机应用与计算机图形学国际学术会议（CACG2024）将于2024年7月12-14日在中国·杭州召开，该会议作为第七届计算机信息科学与应用技术国际学术会议（CISAT2024）分会场召开。会议由浙江工业大学主办、浙江工业大学计算机科学与技术学院承办。会议旨在为从事计算机应用与计算机......
Personalized Prompt for Sequential Recommendation论文阅读笔记
PersonalizedPromptforSequentialRecommendation论文阅读笔记Abstract 由于推荐的标记（即项目）是百万级的，没有具体的可解释语义，推荐中的序列建模应该是个性化的，因此将NLP的提示调整到推荐中的序列调整是具有挑战性的。在这项工作中，我们首先介绍了提示推荐模型，并提出了一......
End-to-End Object Detection with Transformers
郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！Europeanconferenceoncomputervision,2020 Abstract. 我们提出了一种新的方法，将目标检测视为一个直接集预测问题。我们的方法简化了检测流程，有效地消除了对许多手工设计的组件的需求，如非最大值抑制程序或锚生成，这些......
EndNote里参考文献的期刊名显示错误怎么办？
本文介绍EndNote文献管理软件导入文献引用时，期刊名称带有%J前缀从而不能正常显示的解决方法。前期的文章中，我们多次介绍了文献管理软件EndNote的具体使用方法与技巧。而在使用EndNote软件时，我们经常下载.enw等格式的文献数据库导入文件，从而在EndNote软件中导入我们的参考......
DependencyCheck漏洞扫描工具使用
一、简介Dependency-Check是OWASP（OpenWebApplicationSecurityProject）的一个实用开源程序，用于识别项目依赖项并检查是否存在任何已知的，公开披露的漏洞。目前，已支持Java、.NET、Ruby、Node.js、Python等语言编写的程序，并为C/C++构建系统（autoconf和cmake）提供了有限的支持。而......