首页 > 其他分享 >3. 注意力机制

3. 注意力机制

时间:2024-03-19 19:55:05浏览次数:14  
标签:top 矩阵 sqrt 机制 注意力 向量

深度学习中的注意力机制(Attention Mechanism)是一种模仿人类视觉和认知系统的方法,它允许神经网络在处理输入数据时集中注意力于相关的部分。通过引入注意力机制,神经网络能够自动地学习并选择性地关注输入中的重要信息,提高模型的性能和泛化能力。

最典型的注意力机制包括自注意力机制、空间注意力机制和时间注意力机制

1. 自注意力机制

具体而言,对于序列中的每个元素,自注意力机制计算其与其他元素之间的相似度,并将这些相似度归一化为注意力权重。然后,通过将每个元素与对应的注意力权重进行加权求和,可以得到自注意力机制的输出。

输入整个语句的向量到self-attention中,输出对应个数的向量,再将其结果输入到全连接网络,最后输出标签。以上过程可多次重复:

1.1 运行原理

使用\(\alpha\)表示每一个向量之间的关联程度,而也有许多方法产生,例如下图中的两个

上图左边的方法是最常用的,左乘矩阵再进行dot得到\(\alpha\),这也是transformer使用的方法

分别计算关联性可以得到\(\alpha\)

谁的分数更大,谁的v就更影响结果

1.2 总结

上述过程可总结为

  • 输入矩阵\(I\)分别乘以三个\(W\)得到三个矩阵 \(Q,K,V\)。
  • $A=QK^\top $,经过处理得到注意力矩阵 \(A^{\prime}=softmax(\frac{QK^\top}{\sqrt{d_k}})\)
  • 输出\(O=A^{\prime}V\)

\[Attention(Q,K,V)=softmax(\frac{QK^\top}{\sqrt{d_k}})V \]

其中,\({\sqrt{d_k}}\) 为向量的长度。

标签:top,矩阵,sqrt,机制,注意力,向量
From: https://www.cnblogs.com/ratillase/p/18083806

相关文章

  • openGauss Copy接口支持容错机制
    Copy接口支持容错机制可获得性本特性自openGauss1.0.0版本开始引入。特性简介支持将Copy过程中的部分错误导入到指定的错误表中,并且保持Copy过程不被中断。客户价值提升Copy功能的可用性和易用性,提升对于源数据格式异常等常见错误的容忍性和鲁棒性。特性描述openGauss提......
  • langchain chatchat运行机制源码解析
    langchainchatchat的简介就不多说了,大家可以去看github官网介绍,虽然当前版本停止了更新,下个版本还没有出来,但作为学习还是很好的。一、关键启动过程:1、start_main_server入口2、run_controller启动fastchatcontroller端口200013、run_openai_api启动fastchat对外提供的类......
  • python垃圾回收机制
    Python中的垃圾回收机制是自动的,它主要使用了引用计数来追踪和回收内存。1、引用计数当一个对象被创建时,就会被分配一块内存,然后将其引用计数设置为1。当另一个变量引用该对象时,引用计数就会增加1。当一个对象的引用计数变为0时,说明该对象没有任何引用,Python解释器就会将......
  • Python环境下基于注意力机制的小样本轴承故障诊断
    传统的基于特征提取与分类相结合的轴承智能诊断算法,对信号处理要求很高的专家经验,既费时又缺乏通用性。基于深度学习的智能轴承故障诊断方由于具有强大的特征提取能力,避免了繁琐复杂的特征提取工作,但是大多数研究都是在标准数据集下进行的,这意味着模型能够使用足量的数据进行训......
  • Mysql之刷盘机制
    一、刷盘机制总览刷盘过程mysql刷脏数据在写redo之后,逻辑跟oracle一致。checkpoint/commit->内存中的redo到redolog文件->内存中的脏数据到数据盘。但是mysql多一个环节,就是把binlog从binlogcache写入到binlog文件中。binlogcache不是共享内存,是为每个client分......
  • 2024Android研发必问高级面试题,,谈谈Android-Binder机制及AIDL使用
    中高级Android需要的知识技能技能:1.了解android的签名机制(实现原理,具体操作等等),打包机制(多渠道打包,打包流程等等)2.了解apk安装文件压缩(压缩图片,代码压缩,.so文件压缩等等)3.事件分发,View绘制流程,webview相关知识点(与Native的交互,性能优化等)4.熟悉数据库的使用(基本API,第三......
  • HDFS的垃圾回收机制
    HDFS的垃圾回收机制1.垃圾桶机制解析每一个文件系统都会有垃圾桶机制,便于将删除的数据回收到垃圾桶里面去,避免某些误操作删除一些重要文件。回收到垃圾桶里里面的资料数据,都可以进行恢复。2.垃圾桶机制配置HDFS的垃圾回收的默认配置属性为0,也就是说,如果不小心误删除了某样东西......
  • 采用设备认证、通信安全、系统安全三大机制,全方位为业务出海保驾护航
    中国联通推出了创新的跨境物联网产品解决方案,通过一卡双IMSI技术实现无感知切换,为企业海外业务提供了一站式的管理和快速部署能力。一、一卡双IMSI,实现无感知切换中国联通跨境物联网产品解决方案的核心亮点在于其采用的一卡双IMSI技术。这种技术使得物联网设备在跨国使用时,无需......
  • 【即插即用】ELA注意力机制(附源码)
    原文地址:[2403.01123]ELA:EfficientLocalAttentionforDeepConvolutionalNeuralNetworks(arxiv.org)与SE、CA注意力机制的区别:ELA通过在空间维度采用带状池化来提取水平和垂直方向的特征向量,维持细长的核形状以捕捉远距离的依赖关系,同时避免不相关区域对标签预测的......
  • 14_redis哨兵机制
    redis哨兵(sential)哨兵人巡查监控后后台master主机是否故障,如果故障了根据投票数自动将某一个从机转换为主机,继续对外提供服务。哨兵的作用监控redis主机的运行状态,包括主机master和slave。当主机宕机后,能自动将从机切slave换成新的主机master注意哨兵不使用集群,仅仅是和......