首页 > 其他分享 >Transformer、VIT、swin transformer

Transformer、VIT、swin transformer

时间:2023-01-03 12:12:23浏览次数:61  
标签:Transformer swin Head Attention Multi transformer VIT 向量

Transformer:https://blog.csdn.net/qq_37541097/article/details/117691873,总结:

  • Self-Attention:输入n个向量,每个向量得到一组(q,k,v),通过Attention(Q, K,V)将不同向量的(q,k,v)进行相互联系,最后就得到了n个输出。
  • Multi-Head Attention:Multi-Head就是将每个向量得到的(q,k,v)分为多份(多头)

VIT:自然语言中使用Transformer,需要将自然语言编码成特征向量,最后输入到使用Multi-Head Attention组织的网络中。
在图像中,就是利用卷积网络进行特征提取,从而将图像编码成特征向量,最后输入到使用Multi-Head Attention组织的网络中。

Swin-Transformer:这个网络好像没有像VIT中一样,用到了很多的cnn结构??

标签:Transformer,swin,Head,Attention,Multi,transformer,VIT,向量
From: https://www.cnblogs.com/codingbigdog/p/17021673.html

相关文章

  • Transformer Family
    Transformer简介paper:AttentionIsAllYouNeedBert简介paper:BERT:Pre-trainingofDeepBidirectionalTransformersforLanguageUnderstandingT5简介paper:E......
  • Pytorch入门实战(5):基于nn.Transformer实现机器翻译(英译汉)
    ​​使用GoogleColab运行(openInColab)​​​​源码地址​​文章目录​​本文涉及知识点​​​​本文内容​​​​环境配置​​​​数据预处理​​​​文本分词与构造词......
  • 我对Swing各组件的认识
    2010-09-28我对Swing各组件的认识注:整理之前的博客 my263229365   参加工作两个多月了,本来在学校学的是java,方向定位在J2EE的,结果工作后却从事了桌面应用程序的开发,不......
  • 在pycharm里debug以学习huggingface/transformers
    把https://github.com/huggingface/transformers整个zip下载下来把src/transformers文件夹复制出来,放pycharm里,成这样:根据https://github.com/huggingface/transform......
  • Transformer:位置编码
    邱锡鹏NNDL学习笔记  ......
  • 机器学习:Transformer
    目录简介SelfAttention(自注意力机制)Multi-HeadSelfAttention位置编码TransformerBERT简介Transformer由Google在2017提出,是基于注意力机制的模型https://ar......
  • 论文 | SE(3)-Transformers:3D旋转平移等变注意力网络
    导读自注意力机制是最近非常火热的内容。今天这篇文章,作者基于自注意力机制提出SE(3)-Transformer,实现了三维数据中旋转平移的等变性。等变性有什么意义?作者取得了什么样的......
  • 一文带你入门Transformer
    让我们初学一下Transformer,它确实相对难以理解,下面让我们开始吧!朋友们.Don'tworryaboutit前提在这里我们用x<t>表示文本位置→输入用Tx表示文本长度用y<t......
  • 深度学习之Transformer网络
    【博主使用的python版本:3.6.8】本次没有额外的资料下载Packagesorttensorflowastfimportpandasaspdimporttimeimportnumpyasnpimportmatplotlib.pyplo......
  • 利用Transformers库解决句子对分类问题
    目录数据处理数据集介绍数据处理数据集介绍我们选择蚂蚁金融语义相似度数据集AFQMC作为语料,它提供了官方的数据划分,训练集/验证集/测试集分别包含34334/4316/3......