首页 > 其他分享 >自注意力中的不同的掩码介绍以及他们是如何工作的?

自注意力中的不同的掩码介绍以及他们是如何工作的?

时间:2022-10-12 13:14:51浏览次数:84  
标签:个值 令牌 矩阵 介绍 掩码 注意力 向量

在研究自注意力时,有很多的名词需要我们着重的关注,比如填充掩码,前瞻掩码等等,但网上没有太多注意力掩码的教程和它是如何工作的信息,另外还有以下的细节需要详细的解释:

  • 为什么要对多个层应用注意力掩码?、
  • 为什么不沿键和查询应用注意力掩码?
  • 键、查询和值权重是否混淆了原始矩阵的序列顺序?

所以本篇文章将通过写出矩阵来查看这些问题的细节。这样可以对掩码的工作原理有更好的了解。除此以外还可以连接到线性层是如何跨二维工作的,这样可以解决上面第三点的疑问。

问题定义

让我们从一个有 4 个单词的矩阵 X 开始。当这些词被转换成它们的令牌嵌入,每个令牌的嵌入大小将是 3 个值。例如下面是我们的句子:

“a b c D”

现在让我们把这些词变成令牌。

向量a b c D各有3个分量,这个序列本质上是由4个令牌符号组成的。每个令牌是3个值的向量。我们把这些符号变成一个矩阵X。

X是由向量a、b、c和D组成的4 × 3矩阵这是我们想要用自注意力来转化的矩阵。

完整文章:

https://avoid.overfit.cn/post/1042640faa8249da92e405db1cbc3738

标签:个值,令牌,矩阵,介绍,掩码,注意力,向量
From: https://www.cnblogs.com/deephub/p/16784160.html

相关文章

  • 【每周CV论文推荐】初学视觉注意力机制有哪些值得阅读的论文?
    欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。注意力机制是当下计算机视觉和......
  • Nebula Graph介绍和SpringBoot环境连接和查询
    NebulaGraph介绍和SpringBoot环境连接和查询转载请注明来源https://www.cnblogs.com/milton/p/16784098.html说明当前NebulaGraph的最新版本是3.2.1,根据官方的文档......
  • 根据IP和子网掩码取IP段(CIDR)
    一般做风控会对公司的外网IP加白,如果公司的分公司比较多,一般公司的网络工程师会把这些ip以CIDR的格式记录起来,什么是CIDR的格式呢,比如:192.168.0.62/30这里面192.168.0.......
  • 数据库的基本概念和常见的数据库软件介绍
    数据库的基本概念1.数据库的英文单词:DataBase简称:DB2.什么是数据库?用于存储和管理数据的仓库3.数据库的特点持久化存储数据的,其实数据库就是一个文件系统方便存......
  • unity界面介绍及导入模型
    unity界面介绍排版​ 一般刚打开unity默认是如下界面,可以自己拖拽为自己喜欢的布局,也可以使用右上角的Layout中来选择布局。目前显示出来的只是最常用的界......
  • 五大权威的SSL证书颁发机构(CA机构)介绍
    五大权威的SSL证书颁发机构(CA机构)介绍作者:idcspy 分类: 评测 发布时间:2019.07.1908:29:55 更新于:2021.01.2911:17:36如今安装SSL证书已经成为网站建设的标......
  • 缓存概念介绍
     一、缓存是什么?    缓存其实是内存中一个以key-value(键值对)的形式存储数据的一个空间。当然,缓存也可以持久化。常用的缓存技术:Memcached、Ehcache、OsCache、R......
  • rsync介绍
    ####rsync是一个同步的工具,这个工具非常的重要,日常工作中会经常用到,比如从A机器到B机器传输一个文件,去备份一些数据到远程等,不仅仅可以本地到远程,也可以本机到本机的A目录......
  • django配置文件介绍,drf全局异常处理,drf接口文档
    内置认证类、权限类、频率类django配置文件介绍过滤类的其他使用全局异常处理接口文档内置认证类、权限类、频率类#内置的认证类 BasicAuthenticatio......
  • 物体的三维识别与6D位姿估计:PPF系列论文介绍(二)——PPF-MEAM
    ​ 圈里有高质量教程资料、可答疑解惑、助你高效解决问题文章“PointPairFeature-BasedPoseEstimationwithMultipleEdgeAppearanceModels(PPF-MEAM)forRobotic......