首页 > 其他分享 >注意力机制是什么

注意力机制是什么

时间:2022-08-26 09:22:43浏览次数:64  
标签:who 模型 什么 Attention decoder 机制 注意力

假设有一天热爱绘画的你决定去户外写生,你来到一片山坡上,极目远去,心旷神怡。头顶一片蔚蓝,脚踩一席草绿,远处山川连绵,眼前花草送香,暖阳含羞云后,轻风拂动衣襟,鸟啼虫鸣入耳,美景丹青共卷。

 

图1《起风了》插图

你集中精神,拿起画笔将蓝天、白云、青草等等这些元素,按照所思所想纷纷绘入画板。在绘画的过程中,你会持续地关注你构思到画板上的元素(比如蓝天,白云),而不会太多关注那些其他的元素,比如风,虫鸣,阳光等等。即你的精神是聚焦在你关心的那些事物上,这其实就是注意力的体现,这种有意识的聚焦被称为聚焦式注意力(Focus Attention)。

然而,正当你在画板上忘我倾洒的时侯,突然有人在背后喊你的名字,你立马注意到了,然后放下画笔,转头和来人交谈。这种无意识地,往往由外界刺激引发的注意力被称为显著性注意力(Saliency-Based Attention)。

但不论哪一种注意力,其实都是让你在某一时刻将注意力放到某些事物上,而忽略另外的一些事物,这就是注意力机制(Attention Mechanism)。

在深度学习领域,模型往往需要接收和处理大量的数据,然而在特定的某个时刻,往往只有少部分的某些数据是重要的,这种情况就非常适合Attention机制发光发热。

image

图2 机器翻译任务

举个例子,图2展示了一个机器翻译的结果,在这个例子中,我们想将"who are you"翻译为"你是谁",传统的模型处理方式是一个seq-to-seq的模型,其包含一个encoder端和一个decoder端,其中encoder端对"who are you"进行编码,然后将整句话的信息传递给decoder端,由decoder解码出"我是谁"。在这个过程中,decoder是逐字解码的,在每次解码的过程中,如果接收信息过多,可能会导致模型的内部混乱,从而导致错误结果的出现。

我们可以使用Attention机制来解决这个问题,从图2可以看到,在生成"你"的时候和单词"you"关系比较大,和"who are"关系不大,所以我们更希望在这个过程中能够使用Attention机制,将更多注意力放到"you"上,而不要太多关注"who are",从而提高整体模型的表现。

备注:在深度学习领域,无意识的显著性注意力更加常见。

Attention机制自提出以来,出现了很多不同Attention应用方式,但大道是共同的,均是将模型的注意力聚焦在重要的事情上。本文后续将选择一些经典或常用的Attention机制展开讨论。

标签:who,模型,什么,Attention,decoder,机制,注意力
From: https://www.cnblogs.com/beyoncewxm/p/16625157.html

相关文章

  • 有什么方法可以把js注入到TinyMCE中的iframe?
    WordPress6之前的版本用的都是经典编辑器,而编辑器用的就是TinyMCE,所以我们要改动的主角就是它了。还没改之前觉得挺简单的,真去动手改造的时候,就懵逼了,找了半天没有相关的......
  • js有了var为什么还要有let和const?
    为什么javascript中有那么多声明变量的方式,明明是弱类型的语言,确有三个关键字?最早的是var,这是es6之前的声明方式,既然有了var为什么还要有let和const呢?原因很简单,这是......
  • PHP的session垃圾回收机制
     session垃圾回收机制-wen_php-博客园 https://www.cnblogs.com/wenphp/p/4871500.html在PHP中,没有任何变量指向这个对象时,这个对象就成为垃圾。PHP会将其在内......
  • 垃圾回收机制
    怎么判定对象是否为垃圾对象1.引用计数法在每个对象中添加一个引用计数器,当有地方引用这个对象的时候,引用计数器就+1,当引用失效的时候,计数器的值就-1。任何时刻计数......
  • jack与jacky有什么区别
    jack与jacky有什么区别_百度知道 https://zhidao.baidu.com/question/407487746.html英语中如果别人把名字末尾加y是一种比较亲切的叫法,有时甚至会删减字母再加y,意思是......
  • Widows快捷键有什么呢?
    widows快捷键有什么呢?常用的快捷键有ctrl快捷键ctrl+A=全选ctrl+C=复制ctrl+V=粘贴ctrl+S=保存ctrl+P=打印ctrl+Z=撤销ctrl+X=剪切ctrl+B=粗体Alt快捷......
  • python基础-垃圾回收机制
    1.主)引用计数(referencecounting)引用计数为0时,该对象生命就结束了。维护引用计数消耗资源,循环引用L.append(L)L一直不回收(辅)标记清除机制(markandsweep)**目的:**解决......
  • 接口和抽象类有什么区别
    接口和抽象类有什么区别你选择使用接口和抽象类的依据是什么?接口和抽象类的概念不一样。接口是对动作的抽象,抽象类是对根源的抽象。抽象类表示的是,这个对象是什么。......
  • 虚拟现实技术开发发展趋势是什么,你知道吗?华锐互动
    近几年来,VR线上全景展示的热度总是处于时而上升时而下降。而就在今年疫情期间,专家提倡的“无接触式生活方式”同时也使得VR全景展示重回大众视野,成为商迪3D发展的重要转折......
  • ASEMI光伏二极管有哪些型号,光伏二极管有什么应用?
    编辑-ZASEMI光伏二极管有哪些型号?目前有TPA系列和GMK系列,主要是光伏逆变器二极管和光伏防回流二极管,它们的参数如下所示: 型号:TPA3045/TPA4045光伏二极管重复峰值反向......