首页 > 其他分享 >论文笔记 - Rank-detr

论文笔记 - Rank-detr

时间:2024-02-27 19:23:24浏览次数:22  
标签:... detr 论文 笔记 Rank query 排序

1. 前言

这篇论文发表于neurips 2023。

这篇论文要解决什么问题?

  1. rank预测的类别和框体位置会发生错位,预测类别精度高,但是框体位置的定位不是最佳的,论文的改进目标就是将rank分数中类别和框体位置的分数进行统一

这篇论文作出的贡献?

  1. 对Dino中query selection阶段,对Encoder输出的特征生成粗略的边界框预测的top-k的选择排序过程进行改进

论文:
代码:

2. 背景

3. 框架

image

总思路:现代 detection transformers (DETR) 使用一组目标查询(object queries)来预测边界框列表,按分类置信度分数对它们进行排序,并选择top-ranked 预测作为给定输入图像的最终检测结果

3.1 Rank-adaptive Classification Head

以排名为导向的分类头,在原有的分类头中加入了一个偏置

作者将一组可学习的偏置向量\(S^l = \{s^l_1, s^l_2, ..., s^l_n\}\)添加到每个object query相关联的分类分数\(T^l = \{t^l_1, t^l_2, ..., t^l_n\}\),公式如下图所示。
\(Q^l = \{q^l_1, q^l_2, ..., q^l_n\}\)表示第l层输出的decoder embedding
image

image

最终得到第l层的分类预测\(P^l = \{p^l_1, p^l_2, ..., p^l_n\}\)

3.2 Query Rank Layer

image

作者在每一层decoder层都会对content query和position query进行排序,排序的依据就是根据上一层decoder层输出的分类分数\(P^{l-1}\)。有公式如下所示:

image

对H-detr的排序
image
对Dino-detr的排序
image

对Loss的改进

image

3.3 GIoU-aware Classification Loss

image

3.4 High-order Matching Cost

image

4. 实验

标签:...,detr,论文,笔记,Rank,query,排序
From: https://www.cnblogs.com/asteroid7/p/18031094

相关文章

  • 我与计算机的读书笔记
    当我们深入探索这本《我与计算机》的奥秘时,第一章为我们开启了一段追溯个人与计算机相遇、相识、相知的历史长河。它不仅仅是一个技术性的指南,更是一段人类与科技进步共舞的生动叙述。首先,我被书中提到的张淑雅的故事深深吸引。她仿佛是一个时代的缩影,她的经历代表了那一代人对计......
  • 离散微积分学习笔记
    后向差分对于函数\(f(x)\)定义等距节点\(x_k=x_0+k\Deltax\)。有:\[\Deltaf(x_k)=f(x_{k})-f(x_{k-1})\]下文简称差分。高阶差分一般来说,\(k\)阶差分的定义如下:\[\Delta^ka_n=\Delta(\Delta^{k-1}a_n)\]易得\(k\)阶差分公式:\[\Delta^ka_n=\sum_......
  • Vue学习笔记18--列表渲染
    总结: <!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>列表渲染</title>&l......
  • Vue学习笔记18--条件渲染
    条件渲染总结:v-if写法:v-if="表达式"v-else-if="表达式"v-else="表达式"适用于:切换频率较低的场景特点:不展示DOM元素直接被移除注意:v-if可以和v-else-if、v-else一起使用,但要求其结构不能被“打断”——即,中间不能有其他元素v-show写法:v-show="表达式"适用于:切......
  • PMGT论文阅读笔记
    Abstract​ 我们提出了一种预训练的策略,通过考虑项目侧信息及其关系来学习项目表示。我们通过共同的用户活动来关联项目,例如,共同购买,并构建一个同质的项目图。该图提供了在多模态中的项目关系及其关联的边信息的统一视图。我们开发了一种新的采样算法,名为MCN采样,以选择上下文的邻......
  • RabbitMQ 学习笔记
    为什么使用消息队列?以用户下单购买商品的行为举例,在使用微服务架构时,我们需要调用多个服务,传统的调用方式是同步调用,这会存在一定的性能问题使用消息队列可以实现异步的通信方式,相比于同步的通信方式,异步的方式可以让上游快速成功,极大提高系统的吞吐量消息队列的使用场景有如......
  • Semantic Kernel 学习笔记:初步体验用 Semantic Memory 生成 Embedding 并进行语义搜索
    SemanticKernel的Memory有两种实现,一个是SemanticKernel内置的SemanticMemory,一个是独立的KernelMemory,KernelMemory是从SemanticKernel进化而来。关于SemanticMemory的介绍(来源):SemanticMemory(SM)isalibraryforC#,Python,andJavathatwrapsdir......
  • Go语言精进之路读书笔记第37条——了解错误处理的4种策略
    C语言家族的经典错误机制:错误就是值。同时Go结合函数/方法的多返回值机制避免了像C语言那样在单一函数返回值种承载多重信息的问题。37.1构造错误值错误处理的策略与构造错误值的方法是密切关联的。错误是值,只是以error接口变量的形式统一呈现(按惯例,函数或方法通常将error类型......
  • vue3笔记
    2.3.【一个简单的效果】Vue3向下兼容Vue2语法,且Vue3中的模板中可以没有根标签<template> <divclass="person">  <h2>姓名:{{name}}</h2>  <h2>年龄:{{age}}</h2>  <button@click="changeName">修改名字</button>  <button......
  • vue3笔记1
    4.4.【路由器工作模式】history模式优点:URL更加美观,不带有#,更接近传统的网站URL。缺点:后期项目上线,需要服务端配合处理路径问题,否则刷新会有404错误。constrouter=createRouter({history:createWebHistory(),//history模式/******/})hash模式优点:兼容性......