论文提出了一种基于卷积和VIT的混合网络,利用Transformers捕获远程依赖关系,利用cnn提取局部信息。构建了一系列模型cmt,它在准确性和效率方面有更好的权衡。
CMT:体系结构
CMT块由一个局部感知单元(LPU)、一个轻量级多头自注意模块(LMHSA)和一个反向残差前馈网络(IRFFN)组成。
https://avoid.overfit.cn/post/2da9f18b7b6d4da89b44eb16c861ab88
标签:高效,Transformers,卷积,局部,网络,CMT From: https://www.cnblogs.com/deephub/p/17683978.html