注意力机制是什么

时间：2022-08-26 09:22:43浏览次数：64

假设有一天热爱绘画的你决定去户外写生，你来到一片山坡上，极目远去，心旷神怡。头顶一片蔚蓝，脚踩一席草绿，远处山川连绵，眼前花草送香，暖阳含羞云后，轻风拂动衣襟，鸟啼虫鸣入耳，美景丹青共卷。

图1《起风了》插图

你集中精神，拿起画笔将蓝天、白云、青草等等这些元素，按照所思所想纷纷绘入画板。在绘画的过程中，你会持续地关注你构思到画板上的元素（比如蓝天，白云），而不会太多关注那些其他的元素，比如风，虫鸣，阳光等等。即你的精神是聚焦在你关心的那些事物上，这其实就是注意力的体现，这种有意识的聚焦被称为聚焦式注意力（Focus Attention）。

然而，正当你在画板上忘我倾洒的时侯，突然有人在背后喊你的名字，你立马注意到了，然后放下画笔，转头和来人交谈。这种无意识地，往往由外界刺激引发的注意力被称为显著性注意力（Saliency-Based Attention）。

但不论哪一种注意力，其实都是让你在某一时刻将注意力放到某些事物上，而忽略另外的一些事物，这就是注意力机制（Attention Mechanism）。

在深度学习领域，模型往往需要接收和处理大量的数据，然而在特定的某个时刻，往往只有少部分的某些数据是重要的，这种情况就非常适合Attention机制发光发热。

图2 机器翻译任务

举个例子，图2展示了一个机器翻译的结果，在这个例子中，我们想将"who are you"翻译为"你是谁"，传统的模型处理方式是一个seq-to-seq的模型，其包含一个encoder端和一个decoder端，其中encoder端对"who are you"进行编码，然后将整句话的信息传递给decoder端，由decoder解码出"我是谁"。在这个过程中，decoder是逐字解码的，在每次解码的过程中，如果接收信息过多，可能会导致模型的内部混乱，从而导致错误结果的出现。

我们可以使用Attention机制来解决这个问题，从图2可以看到，在生成"你"的时候和单词"you"关系比较大，和"who are"关系不大，所以我们更希望在这个过程中能够使用Attention机制，将更多注意力放到"you"上，而不要太多关注"who are"，从而提高整体模型的表现。

备注：在深度学习领域，无意识的显著性注意力更加常见。

Attention机制自提出以来，出现了很多不同Attention应用方式，但大道是共同的，均是将模型的注意力聚焦在重要的事情上。本文后续将选择一些经典或常用的Attention机制展开讨论。

标签：who,模型,什么,Attention,decoder,机制,注意力
From： https://www.cnblogs.com/beyoncewxm/p/16625157.html

有什么方法可以把js注入到TinyMCE中的iframe？
WordPress6之前的版本用的都是经典编辑器，而编辑器用的就是TinyMCE，所以我们要改动的主角就是它了。还没改之前觉得挺简单的，真去动手改造的时候，就懵逼了，找了半天没有相关的......
js有了var为什么还要有let和const？
为什么javascript中有那么多声明变量的方式，明明是弱类型的语言，确有三个关键字？最早的是var，这是es6之前的声明方式，既然有了var为什么还要有let和const呢？原因很简单，这是......
PHP的session垃圾回收机制
session垃圾回收机制-wen_php-博客园 https://www.cnblogs.com/wenphp/p/4871500.html在PHP中，没有任何变量指向这个对象时，这个对象就成为垃圾。PHP会将其在内......
垃圾回收机制
怎么判定对象是否为垃圾对象1.引用计数法在每个对象中添加一个引用计数器，当有地方引用这个对象的时候，引用计数器就+1，当引用失效的时候，计数器的值就-1。任何时刻计数......
jack与jacky有什么区别
jack与jacky有什么区别_百度知道 https://zhidao.baidu.com/question/407487746.html英语中如果别人把名字末尾加y是一种比较亲切的叫法,有时甚至会删减字母再加y，意思是......
Widows快捷键有什么呢？
widows快捷键有什么呢？常用的快捷键有ctrl快捷键ctrl+A=全选ctrl+C=复制ctrl+V=粘贴ctrl+S=保存ctrl+P=打印ctrl+Z=撤销ctrl+X=剪切ctrl+B=粗体Alt快捷......
python基础-垃圾回收机制
1.主）引用计数（referencecounting）引用计数为0时，该对象生命就结束了。维护引用计数消耗资源，循环引用L.append(L)L一直不回收（辅）标记清除机制（markandsweep）**目的：**解决......
接口和抽象类有什么区别
接口和抽象类有什么区别你选择使用接口和抽象类的依据是什么？接口和抽象类的概念不一样。接口是对动作的抽象，抽象类是对根源的抽象。抽象类表示的是，这个对象是什么。......
虚拟现实技术开发发展趋势是什么，你知道吗？华锐互动
近几年来，VR线上全景展示的热度总是处于时而上升时而下降。而就在今年疫情期间，专家提倡的“无接触式生活方式”同时也使得VR全景展示重回大众视野，成为商迪3D发展的重要转折......
ASEMI光伏二极管有哪些型号，光伏二极管有什么应用？
编辑-ZASEMI光伏二极管有哪些型号？目前有TPA系列和GMK系列，主要是光伏逆变器二极管和光伏防回流二极管，它们的参数如下所示：型号：TPA3045/TPA4045光伏二极管重复峰值反向......

注意力机制是什么

相关文章

赞助商

阅读排行