网站首页
编程语言
数据库
系统相关
其他分享
编程问答
LaViT
2024-08-26
LaViT:Less-Attention Vision Transformer的特性与优点
引言https://arxiv.org/pdf/2406.00427随着计算机视觉领域的发展,视觉Transformer(ViTs)逐渐成为一项重要技术。尽管ViTs在捕捉图像中的长距离依赖关系方面表现出色,但其沉重的计算负担和潜在的注意力饱和问题一直是实际应用的障碍。为解决这些问题,微软提出了Less-AttentionV