首页 > 其他分享 >[Base] Agent Attention

[Base] Agent Attention

时间:2024-08-19 18:56:00浏览次数:8  
标签:Transformer Linear 复杂度 Attention Agent Base Softmax Ablation

1. BaseInfo

TitleAgent Attention: On the Integration of Softmax and Linear Attention
Adresshttps://arxiv.org/pdf/2312.08874
Journal/Time202312 ECCV2024
Author清华自动化系
Codehttps://github.com/LeapLabTHU/Agent-Attention
TableAttention

2. Creative Q&A

Q:
Swin Transformer: 缩小感受野,局部自注意力。
PVT: 稀疏注意力模式,通过减少 Q 和 V 的数量。
影响长程关系建模能力,并且仍然不如全局自我关注机制。
A:
主要是针对 Softmax 计算复杂度的改进。引入了 A 的额外 token 。利用注意权重之间的冗余来实现高模型表达性和低计算复杂度。计算复杂度低了后,就可以采用更大的感受野。
Motivation

3. Concrete

可应用下游任务:

  • Classification
  • Segmentation
  • Detection
  • Agent Attention for Stable Diffusion

3.1. Model

model
Softmax 和 Linear Attention 的集成。

在这里插入图片描述
DWC : depthwise convolution
tokens A is obtained through pooling

3.2. Dataset

  • ImageNet1K classification
  • ADE20K semantic segmentation
  • COCO object detection

3.3. Eval

在这里插入图片描述
在这里插入图片描述

3.4. Ablation

  • Ablation on key designs.
  • Ablation on number of agent tokens.
  • Comparison with Other Linear Attention
    在这里插入图片描述

3.5. Appendix

与 GPViT 和 GRL 的不同之处。
内容很丰富,后面实验的时候再仔细看吧…

4. Reference

Our code is developed on the top of PVT, Swin Transformer, CSwin Transformer and ToMeSD.

5. Additional

不想看代码就先读论文。在周三之前把 3 篇读完,尝试一下 SLViT 。
我现在看 0815 写的桥接论文给自己提出的问题都还没解决。
事情一件一件做吧。
我怎么觉得这篇论文我也看过,甚至在周报里还写过。
这个公式证明倒是写的也挺简洁明了。图也画的挺清晰的。
实验内容是真的丰富。附录里还有很多实验设置。
30页的论文。是一个即插即用的 Attention 模块。
笔记写的简略。

标签:Transformer,Linear,复杂度,Attention,Agent,Base,Softmax,Ablation
From: https://blog.csdn.net/weixin_45863274/article/details/141331149

相关文章

  • HBase学习的第六天--Hbase之过滤器
    Hbase之过滤器HBase的基本API,包括增、删、改、查等。增、删都是相对简单的操作,与传统的RDBMS相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根据行键的范围来查询(Scan)。HBase不仅提供了这些简单的查询,而且提供了更加高级的过滤器(Filter)来查询。过滤器可......
  • 书生大模型实战营3期 - 进阶岛 - 2 - Lagent 自定义你的 Agent 智能体
    文章目录闯关任务完成结果闯关任务任务描述:Lagent自定义你的Agent智能体任务文档:Lagent自定义你的Agent智能体完成结果使用Lagent自定义一个智能体,并使用LagentWebDemo成功部署与调用,记录复现过程并截图。环境准备/安装:#创建环境condacreate-n......
  • 医学GraphRAG:通过知识图谱检索增强实现医疗行业AI Agent应用
    近年来,伴随着人工智能的迅速发展,AI大模型凭借其卓越的数据处理能力和深度学习能力,正在成为医疗健康领域变革的关键动力,将大模型应用与具体的医疗场景,已经成为推动医疗行业智慧化升级的重要课题。然而,这些大模型在应用于像医学这样需要专业知识的领域时,仍然面临局限性,主要有两个......
  • C#开发的应用升级管理器LUAgent客户端 - 开源研究系列文章 - 个人小作品
          以前就想开发应用的升级更新的程序,也想过把升级工具单独弄成类库模块化。后来就想到要开发服务端和客户端独立出来,只要配置好就能够对任何应用进行升级更新操作。笔者将这个命名为:LUAgent,即LzhdimUpdateAgent,升级更新代理,上次发布了服务端工具:https://www.cnb......
  • HBase学习的第五天--HBase的·拓展-Phenix
    六、Phoenix3、phoenix表映射默认情况下,直接在hbase中创建的表,通过phoenix是查看不到的如果需要在phoenix中操作直接在hbase中创建的表,则需要在phoenix中进行表的映射。映射方式有两种:视图映射和表映射3.1、视图映射Phoenix创建的视图是只读的,所以只能用来做查询,无法通......
  • 叠Buff!经典麻雀优化算法+多重双向深度学习!SSA-BiTCN-BiGRU-Attention多输入单输出回
    叠Buff!经典麻雀优化算法+多重双向深度学习!SSA-BiTCN-BiGRU-Attention多输入单输出回归预测目录叠Buff!经典麻雀优化算法+多重双向深度学习!SSA-BiTCN-BiGRU-Attention多输入单输出回归预测效果一览基本介绍程序设计参考资料效果一览基本介绍1.Matlab实现SS......
  • Configuring the Cisco IOS XE DHCP Relay Agent
    CiscoroutersrunningCiscoIOSXEsoftwareincludeDynamicHostConfigurationProtocol(DHCP)serverandrelayagentsoftware.ADHCPrelayagentisanyhostthatforwardsDHCPpacketsbetweenclientsandservers.Thismoduledescribestheconceptsandt......
  • Cannot find a valid baseurl for repo: centos-sclo-rh/x86_64
    yuminstall报错:Cannotfindavalidbaseurlforrepo:centos-sclo-rh/x86_64问题原因CentOS7的SCL源在2024年6月30日停止维护了。当scl源里面默认使用了centos官方的地址,无法连接,需要替换为阿里云。解决办法1、重命名原来的文件:cd/etc/yum.repos.d/找到CentOS-SC......
  • 2024 NVIDIA Summer Camp Day1:构建RAG多模态AI Agent
    下载材料和课件等课程相关资料下载链接:https://pan.baidu.com/s/15Y-gmsfeYCgKF-M3TJZVgg?pwd=fafe提取码:fafe 1.课件链接:https://pan.baidu.com/s/15JTy9CqnesXSlPiwwrUmjA?pwd=1111 提取码:1111 2.phi3量化大模型链接:https://pan.baidu.com/s/10HqxpkJmSyg-Bb......
  • LangGraph Studio:首款智能体(agent)IDE
    0前言LangGraphStudio提供了一个专门的智能体IDE,用于可视化、交互和调试复杂的智能体应用程序。本文来了解如何在桌面使用。LLM为新型智能体应用程序的发展铺平了道路——随这些应用程序演进,开发它们所需工具也必须不断改进。今天推出的LangGraphStudio——首款专为Agent开......