首页 > 其他分享 >旋转位置编码Rope

旋转位置编码Rope

时间:2024-12-13 15:55:10浏览次数:5  
标签:编码 begin end im 旋转 Rope pmatrix theta Hello

1.背景

   注意力机制本身没有获取位置信息的能力,对于transformer来说"Hello world"和"world Hello"两句话中的"Hello"张量是完全相同的,即使两句话中的相同Hello可能有不同的表达含义,所以需要在输入信息中添加位置信息

2.原理

   transformer中KQV都是而二维的张量,所以可以用复数空间来表示输入数据的位置信息。

3.公式

   对于一个输入\(x_m\),有\(f_q(x_m, m) = (W_qx_m)e^{im\theta}\),其中\(e^{im\theta}\)就是添加的位置信息,由欧拉公式可得:\(e^{im\theta} = cos(i\theta) + isin(i\theta)\)。假设输入的长度为2。
\(q_{m} = \left( \begin{array}{c} q_{m}^{(1)} \ q_{m}^{(2)} \end{array} \right) = W_{q}x_{m} = \begin{pmatrix} W_{q}^{(11)} & W_{q}^{(12)} \\ W_{q}^{(21)} & W_{q}^{(22)} \end{pmatrix}\begin{pmatrix} x_{m}^{(1)} \\ x_{m}^{(2)} \end{pmatrix}\)。这里的\(q_{m}^{(1)}, q_{m}^{(2)}\)可视为一个在复数平面的坐标。
那么\(q_m\)可表示为\(q_{m}^{(1)} \ +q_{m}^{(2)}i\),带入\((W_qx_m)e^{im\theta}\)可得:\(\begin{pmatrix} \cos(m\theta) & -\sin(m\theta) \\ \sin(m\theta) & \cos(m\theta) \end{pmatrix} \begin{pmatrix} q_m^{(1)} \\ q_m^{(2)} \end{pmatrix}\)
扩展到长度为\(d/2\):

标签:编码,begin,end,im,旋转,Rope,pmatrix,theta,Hello
From: https://www.cnblogs.com/boke626/p/18605125

相关文章

  • 如何通过 AI 代码助手实现编码效率的飞跃
    腾讯云AI代码助手是一款革命性的编码辅助工具,它在程序员编写代码时发挥着至关重要的作用——预测并提供下一句或下一段代码的建议。你可能会疑惑,既然 IDE已经具备基本的代码补全功能,为何还需要AI代码助手呢?这里的关键在于AI代码助手能够深入理解代码的上下文环境,提供逻辑和......
  • 三维坐标旋转矩阵推导过程以及C语言实现
    此篇文章在2023年9月13日被记录前提:坐标使用右手坐标系,角度逆时针旋转为正。绕X轴旋转角度为俯仰角即Pitch绕Y轴旋转角度为偏航角即Yaw(Head)绕Z轴旋转角度为翻滚角即Roll1、平面二维坐标点的旋转根据三角函数关系,可以列出向量OP与OP'的坐标表示形式:x=|OP|•co......
  • Post请求的两种编码格式:application/x-www-form-urlencoded和multipart/form-data
    一、前端表单提交时application/x-www-form-urlencoded表单代码:<formaction="http://localhost:8888/task/"method="POST">Firstname:<inputtype="text"name="firstName"value="Mickey&"><br>Last......
  • 哨兵1号卫星处理-地理编码校正
    哨兵1号卫星数据是SAR数据,与光学影像不同,是一种雷达数据。有时候打卡图像发现,方向是颠倒的,这个因为数据还没有进行地理编码。这个时候需利用SNAP软件要先对数据进行热噪声去除-相干波滤波-地形校正等诸多前处理步骤(一定要先做轨道校正,不然的话会报错),之后在Radar-Geometric-Elli......
  • 专为高性能汽车设计的Armv9架构的Neoverse V3AE CPU基础知识与软件编码特性解析
    一、ARMv9以及V3AE处理器架构Armv9架构的ArmNeoverseV系列处理器是专为高性能计算设计的产品线,其中V3AE(AdvancedEfficiency)特别强调了性能与效率之间的平衡。以下是关于Armv9架构下NeoverseV3AE处理器结构和指令集的一些详细解读:Armv9架构概述Armv9是ARM最新一代......
  • RoPE论文阅读笔记
    复数几何意义:https://zhuanlan.zhihu.com/p/646598747https://zhuanlan.zhihu.com/p/359502624Motivation&Abs作者提出了旋转位置编码(RotaryPositionEmbedding,RoPE)的新方法来有效利用位置信息。RoPE使用旋转矩阵对绝对位置进行编码,同时在自注意公式中纳入了明确的相对......
  • 写一个特效:鼠标经过文字时,文字旋转360度
    //HTML<spanclass="rotatable-text">旋转文字</span>//CSS.rotatable-text{display:inline-block;/*orblock,dependingonyourneeds*/transition:transform0.3sease-in-out;/*Adjustdurationandeasingasneeded*/}.rot......
  • 位置编码祛魅 | 详解Transformer中位置编码Positional Encoding
    往期精彩内容:Python-凯斯西储大学(CWRU)轴承数据解读与分类处理基于FFT+CNN-BiGRU-Attention时域、频域特征注意力融合的轴承故障识别模型-CSDN博客基于FFT+CNN-Transformer时域、频域特征融合的轴承故障识别模型-CSDN博客Python轴承故障诊断(11)基于VMD+CNN-BiG......
  • 三相异步电动机为什么能够旋转?
    三相异步电动机,作为一种广泛应用于工业、农业及其他领域的电动机,其工作原理的理解对于工程技术人员以及相关从业者来说至关重要。一、三相异步电动机的基本结构三相异步电动机主要由定子、转子和机壳组成。定子是电动机的静止部分,包含多个电磁线圈,而转子则是可旋转的部分,通常......
  • DriverPropertyBagTool.exe 是一个命令行工具,主要用于处理驱动程序的属性包(Property B
    DriverPropertyBagTool.exe是一个命令行工具,主要用于处理驱动程序的属性包(PropertyBag)。它允许用户将不同的数据项添加到属性包中,这些数据项可以是文件、字节数组或是流形式的数据。通过这个工具,你可以创建或更新驱动程序安装过程中使用的属性包,这对于定制化驱动程序部署或者在......