首页 > 其他分享 >Attention、Self-Attention 与 Multi-Head Attention

Attention、Self-Attention 与 Multi-Head Attention

时间:2023-06-11 09:11:15浏览次数:31  
标签:Multi Vocabulary Self Attention 维度 句子 输入

Corpus语料库与DB数据库

World Knowledge世界常识库:OALD牛津高阶/Synonyms/Phrases/…, 新华字典/成语词典/辞海, 行业词典,大英百科,Wikipedia,…
全局信息: Corpus语料库、行业通用数据库(例如Springer/Google Scholar/Academia/…学术数据库)/领域库、用户自定义库;
语法信息:输入句子的历史记录;
句法信息:当前动态输入句子;
上下文信息:提取 当前输入词 的 词向量 时用到的长度设为 N 的滑动窗口长度范围的字符序列信息

Attention 与 Self-Attention:

Attention = f(Q, (K, V))

Attention 的 (K, V)是预训练时,
使用 Corpus语料库 或 World Knowledge世界常识库 统计训练得到。
Vocabulary是静态的,维度是定长的,Vocabulary尽可能收集到完整的样本空间。
Attention是词向量 与 Vocabulary 的每一个词计算Similarity相似度

Self-Attention 的 K, V 是预测时,使用 当前输入句子,以及输入句子的历史记录,动态训练的;
Vocabulary是动态的,维度变长的,Vocabulary尽可能收集到当前会话或全部会话的,输入句子历史记录
有一个处理Tips:
正像用 定长的滑动窗口 将 变长的动态输入句子 进行采样。
可将变长的Vocabulary维度,通过padding组织成定长的维度。
Self-Attention是当前输入句子的每一个词,与当前输入句子(Self)的每一个词计算Similarity相似度

标签:Multi,Vocabulary,Self,Attention,维度,句子,输入
From: https://www.cnblogs.com/abaelhe/p/17472486.html

相关文章

  • Searching for a String in Multiple Files
    常用命令:grep-r-n-B1-A1--include=*.cstrstr*findstr/S"MB_ICONHAND"*.h Everneedtosearchthroughallyourfilesforacertainwordorphrase?Idid,andtomakemattersmorecomplicated,thefileswereallindifferentsub-directories.......
  • 【C#/.NET】Dapper使用QueryMultipleAsync执行多条SQL
    ​ 目录 背景解决方案总结 背景        对于查询数据列表的功能,需要分页已经查询总数。这里涉及两句SQL,一个是查询分页对应的数据,第二个是Count(*);会导致部分重复代码和两次的数据库查询。 解决方案        Dapper有封装QueryMultipleAsync的......
  • [ABC166E] This Message Will Self-Destruct in 5s
    ThisMessageWillSelf-Destructin5sの传送门Solution首先看到\(j-i=A_i+A_j\)转换一下,\(i+a_i=j-a_j\)。接下来,对于每一个\(i\)(\(1\lei\len\)),用一个map存\(i-a_i\)的数量。最后枚举\(i\)(\(1\lei\len\)),每次将\(ans\)加上\(i+a_i\)在map里的数......
  • vm - 网卡故障-没有分配ip - mv ens33: <BROADCAST,MULTICAST> mtu 1500 qdisc noop s
    执行指令sudodhclientens33即可恢复红色部分,需要查看自己的机器,改为后缀即可cd/etc/sysconfig/network-scripts 需要等待一会才能刷新,使用 servicenetworkrestart 刷新会失败......
  • [Multimedia][ChatGPT] 如何使用 ffmpeg 将一个包含绿幕的前景视频叠加到背景视频上,并
    要使用ffmpeg将包含绿幕的前景视频叠加到背景视频上,并将前景视频中的绿幕设置为透明色,您需要以下步骤:安装ffmpeg。首先确保您已安装了最新版本的ffmpeg。如果还没有安装,请访问官方网站下载并安装相应版本。使用chromakey过滤器将绿幕替换为透明色。chromakey过滤器可以识......
  • 4_How to Host Multiple Websites on One Server
     地址:https://www.codewithharry.com/blogpost/host-multiple-websites-ubuntu-vps/  HowtoHostMultipleWebsitesonUbuntuVPS?Anapache2webserverprovidesrobustnessandscalabilityforhostingmultiplewebsitesonyourUbuntuVPS.Thismeansyoucan......
  • Spring中如何使用RestTemplate将MultipartFile类型数据发送给被调用方
    被调用方代码@PostMapping("/certificateUpload")publicResult<?>certificateUpload(@RequestPart("file")MultipartFilefile,@RequestParamStringcertificateType){returncertifica......
  • 2_Transferring Files, Passwordless login & Managing multiple servers
     原文:https://www.codewithharry.com/blogpost/transferring-files-passwordless-login-ubuntu-20-04/ TransferringFiles,Passwordlesslogin&ManagingmultipleserversInthispost,Iwillshowyouhowtoavoidenteringpasswordsmultipletimeswhilema......
  • 01.Self—attention
    self—attention自注意力机制一、输入在学习自注意力机制之前,我们学到的神经网络的输入都是一个向量,输出可能是一个数值或者是一个类别。1.举个例子。假设输入的向量是一排向量,而且输入的向量的数目是会改变的,最简单的输入长度会改变的向量就是文字处理,假设我们的输入是一个......
  • The 'Access-Control-Allow-Origin' header contains multiple values'*, *', but onl
    报错内容The'Access-Control-Allow-Origin'headercontainsmultiplevalues'*,http://192.168.237.131',butonlyoneisallowed.Havetheserversendtheheaderwithavalidvalue,or,ifanopaqueresponseservesyourneeds,setthereque......