首页 > 其他分享 >ATC:多快好省,无参数token reduction方法 | ECCV'24

ATC:多快好省,无参数token reduction方法 | ECCV'24

时间:2024-11-06 09:33:06浏览次数:1  
标签:24 ATC equation 合并 token 多快好省 聚类 方法

来源:晓飞的算法工程笔记 公众号,转载请注明出处

论文: Agglomerative Token Clustering

创新点


  • 提出了层次token聚类(Agglomerative Token ClusteringATC),这是一种新型的无参数层次合并的token减少方法。
  • 基于ATC,在图像分类、图像合成,以及目标检测和分割任务上实现了最先进的性能,超越了所有其他token减少方法,包括基于合并的和基于修剪的token减少方法。
  • 在图像分类和目标检测与分割任务中,ATC可以在未经过任何微调的情况下(即开箱即用),达到与之前微调的最先进性能相当的效果。

内容概述


层次token聚类(Agglomerative Token Clustering,简称ATC)是一种新型的token合并方法,在图像分类、图像合成以及目标检测与分割任务中始终优于以往的token合并和修剪方法。ATC通过自下而上的层次聚类来合并簇,而无需引入额外的可学习参数。

在所有任务中,ATC都实现了最先进的性能。在不进行微调的情况下,甚至可以与之前的最先进技术相媲美。ATC在低保留率下尤其有效,此场景仅保留了少量的token,而保持任务性能尤其困难。

层次token聚类


与之前的token合并方法类似,ATC的目标是合并冗余token,同时保持或提升ViT模型的性能。在ViT块的自注意力和多层感知机(MLP)模块之间插入token合并操作,这与之前的基于合并的方法是一致的,比如ToMe

层次聚类是一种经典的自下而上的层次聚类方法,其中每个元素最初都是其自身的聚类。通过根据某种连结函数和距离度量 \(D(\cdot)\) 迭代比较聚类,将两个最接近的聚类在每次迭代中合并。这一过程会持续进行,直到满足某个停止标准,例如所需聚类的数量(形成静态缩减方法),或者聚类之间的最小距离(形成动态缩减方法)。

论文考虑静态缩减场景,使用余弦距离作为距离度量 \(D(\cdot)\) ,并使用自注意力模块的键作为token特征。连结函数的选择对元素的聚类方式会有很大影响,主要有三种最常见的连结函数:单个,完整和平均。

\[\begin{equation} D(I,J)^{\text{single}} = \min_{i\in I,\ j\in J} D(i,j) \end{equation} \]

\[\begin{equation} D(I,J)^{\text{complete}} = \max_{i\in I,\ j\in J} D(i,j) \end{equation} \]

\[\begin{equation} D(I,J)^{\text{average}} = \frac{1}{|I||J|}\sum_{i\in I}\sum_{j\in J}D(i,j) \end{equation} \]

其中 \(I\) 和 \(J\) 是包含元素 \(i \in I\) 和 \(j \in J\) 的聚类。

在达到停止标准之后,对每个聚类中的token进行平均,以获得更新的聚类表示。然而,随着token的合并,它们代表的不止一个输入图像块。为了更好地利用能够捕捉更大空间范围的token,使用加权平均作为聚类表示,并在自注意力模块中使用成比例的注意力。

主要实验




如果本文对你有帮助,麻烦点个赞或在看呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】

work-life balance.

标签:24,ATC,equation,合并,token,多快好省,聚类,方法
From: https://www.cnblogs.com/VincentLee/p/18529287

相关文章

  • 2024-2025-1 20241310 《计算机基础与程序设计》第7周学习总结
    2024-2025-120241310《计算机基础与程序设计》第7周学习总结作业信息这个作业属于哪个课程2024-2025-1-计算机基础与程序设计这个作业要求在哪里2024-2025-1计算机基础与程序设计第一周作业这个作业的目标自学教材《计算机科学概论》(第七版)第8章并完成云班课测......
  • 2024/11/06
    软件设计实验10:组合模式用透明组合模式实现教材中的“文件夹浏览”这个例子。类图 publicabstractclassAbstractFile{   publicabstractvoidadd(AbstractFileelement);   publicabstractvoidremove(AbstractFileelement);   publicabstractv......
  • ssm小说租阅管理系统-计算机毕业设计源码93246
    摘 要随着互联网的快速发展,数字化阅读逐渐成为人们获取知识和娱乐的主要方式之一。为了满足读者对多样化阅读需求的需求,本文设计并实现了一款小说租阅系统。该系统基于SSM框架搭建,采用HTML编写前端页面,通过前后台分离的方式实现了读者用户、管理员和作者用户的不同功能模块......
  • 【2024潇湘夜雨】WIN11_Pro-Workstation_24H2.26120.2213软件选装纯净特别版11.5
    【系统简介】=============================================================1.本次更新母盘来自WIN11_Pro-Workstation_24H2.26120.2213.进桌面后稍等片刻,等待后续部分优化完成。2.全程离线精简、无人值守调用优化处理制作。部分优化适配系统可能要重启几次,即使显示适配失败也不......
  • IDEA 2024 安装激活教程(附激活补丁,亲测有效)
    第一步前往idea的官网,下载新版的idea下载完成后,进行安装,next,安装完成首次打开,会要求输入激活码才能使用第二步点击获取补丁文件保存下载之后进入文件夹***/JetBrains2023最新全家桶激活***找到文件/方式3:永久激活补丁+脚本(适合最新版本,可显示到2025年)点击进入/scr......
  • 20241105
    T1沙漠点列直接考虑贪心。容易发现首先一定是先割不在环上的边,这种边每割一条连通块数量增加\(1\)。然后考虑对环下手。要对一个环进行有用的操作,首先需要先割掉其上的一条边,这次操作不产生贡献。我们希望这样的无用操作尽可能少,于是按照从大往小的顺序割环即可。代码#inc......
  • 关于 IntelliJ IDEA 2024 安装激活教程(亲测有效~)
    第一步速度慢的点击这里进行下载第二步点击xx关掉程序!第三步点击获取补丁文件打开标注的文件注意:以后这个文件夹不要动点击进入/scripts点击【确定】按钮后,过程大概5-30秒,如看到弹框提示Done时,表示成功完成,之后打开idea输入6G5NXCPJZB-eyJsaWNlbnN......
  • CSP2024 游记
    Day-1初赛就用Day-1好了。虽然已经拿过J组1=了但还是去参加J组了捏。。。初赛感觉打得挺好的qwq。强烈谴责泄题行为。。。不知道复赛会考什么呢。。。出成绩了。。。J91.5,S79.5,都稳了,准备开始搞复赛。Day0提前一天来到考点附近!住酒店爽爽爽!和同学聊了聊,一......
  • 20222408 2024-2025-1 《网络与系统攻防技术》实验四实验报告
    1.实验内容1.1实验要求(1)对恶意代码样本进行识别文件类型、脱壳、字符串提取操作。(2)使用IDAPro静态或动态分析所给的exe文件,找到输出成功信息的方法。(3)分析恶意代码样本并撰写报告,回答问题。(4)对于Snort收集的蜜罐主机5天的网络数据源进行分析,回答问题。1.2学习内容恶意代码......
  • 2024码上启程!-我的第一篇博客
     CSDN的博客朋友们大家好,我是一个对编程充满热情的大二学生,由软件工程专业出身,步入大学以来一直对科技和代码有着浓厚的兴趣,今后我会将我所写的代码和在大学期间所学的编程知识,遇到的编程问题,以博客的形式发布到网上,希望和大家一起探讨,学习,解决一些编程上的问题。一、编程......