首页 > 其他分享 >【杂学】先进的 NLP 技术 —— 旋转位置编码(Rotary Position Embedding,RoPE)

【杂学】先进的 NLP 技术 —— 旋转位置编码(Rotary Position Embedding,RoPE)

时间:2024-11-11 23:20:03浏览次数:1  
标签:NLP 杂学 编码 位置 绝对 pos Embedding 序列 2i

Transformer 已经渐渐成为目前 LLM 最通用底层架构之一,其中的位置编码也显得极其重要,由于注意力分数本质上是每个 token 的 val 加权和,并没有考虑其中的空间信息,因此需要在自注意力模块之前就将位置信息融合进序列中。

绝对位置编码

绝对位置编码是一种将序列中的每个位置进行编码的方法,它为每个位置分配一个唯一的编码向量。其优势在于它不依赖于序列中的其他元素,可以独立地表示每个位置的信息,比较简单容易计算。

Transformer 所用的就是绝对位置编码策略,计算公式如下:

\[\text{PE}(pos,2i)=\sin(pos/10000^{2i/d}) \]

\[\text{PE}(pos,2i+1)=\cos(pos/10000^{2i/d}) \]

其缺点也比较明显:

  1. 绝对位置编码无法反应不同词之间的相对关系,例如位置 1 和 2 跟 5 和 500 的差异是一样的
  2. 表示不了比预训练文本长度更长的位置向量表示,如果预训练最大长度为 512 的话,那么最多就只能处理长度为 512 的句子,再长就处理不了了。

相对位置编码

旋转位置编码

标签:NLP,杂学,编码,位置,绝对,pos,Embedding,序列,2i
From: https://www.cnblogs.com/keanshi/p/18540794

相关文章

  • CLIPFit:不绕弯子,直接微调比提示微调和适配器微调更好 | EMNLP'24
    来源:晓飞的算法工程笔记公众号,转载请注明出处论文:Vision-LanguageModelFine-TuningviaSimpleParameter-EfficientModification论文地址:https://arxiv.org/abs/2409.16718论文代码:https://github.com/minglllli/CLIPFit创新点提出了一种CLIPFit方法以高效地微......
  • 《Consensus-Aware Visual-Semantic Embedding for Image-Text Matching》中文校对版
    文章汉化系列目录文章目录文章汉化系列目录摘要关键词引言2相关工作2.1基于知识的深度学习2.2图文匹配3共识感知的视觉-语义嵌入3.1利用共识知识增强概念表示3.2共识感知表示学习3.3训练和推理4实验4.1数据集和设置4.2实现细节4.3与最新技术的比较4.4消......
  • NLP论文速读|Describe-then-Reason: 通过视觉理解训练来提升多模态数学的推理
    论文速读|Describe-then-Reason:ImprovingMultimodalMathematicalReasoningthroughVisualCompre-hensionTraining论文信息:简介:   该论文试图解决的问题是开源多模态大型语言模型(MLLMs)在复杂多模态数学推理任务中的表现不佳的问题。尽管这些模型在处理涉......
  • Azure OpenAI Embeddings vs OpenAI Embeddings
    题意:AzureOpenAI嵌入与OpenAI嵌入问题背景:IsanyonegettingdifferentresultsfromAzureOpenAIembeddingsdeploymentusingtext-embedding-ada-002thantheonesfromOpenAI?Sametext,samemodel,andtheresultsareconsiderablyfarinthevectorsp......
  • 【NLP】使用 SpaCy 通过 LLM 合成数据微调 NER 模型
    在我们之前的文章“使用SpaCy、ollama创建用于命名实体识别的合成数据集”中,我们探讨了如何使用Qwen生成合成数据,以自动化命名实体识别(NER)的注释过程。通过利用合成数据,我们能够高效地准备来自SmoothNLP金融新闻数据集  的高质量数据集。现在,在这篇文章中,我们将更进......
  • Pytorch用BERT对CoLA、新闻组文本数据集自然语言处理NLP:主题分类建模微调可视化分析-C
     原文链接:https://tecdat.cn/?p=38181原文出处:拓端数据部落公众号自然语言处理(NLP)领域在近年来发展迅猛,尤其是预训练模型的出现带来了重大变革。其中,BERT模型凭借其卓越性能备受瞩目。然而,对于许多研究者而言,如何高效运用BERT进行特定任务的微调及应用仍存在诸多困惑。本文......
  • 研0找实习【学nlp】12-简历修改篇,应体现的内容
    在申请NLP实习时,简历应该突出与自然语言处理相关的技能和经验。以下是一些建议,帮助你在简历中展示你的能力:简历应体现的内容1.编程语言Python:大多数NLP库和工具都是用Python编写的,因此熟练掌握Python是必不可少的。R或Java(可选):如果你有使用这些语言的经验,可......
  • 75_api_intro_text_nlpsimilarity
    文本语义相似度检测API数据接口专注于语义相似判断,基于NLP,基于机器学习。1.产品功能秒级分析性能;基于NLP算法智能计算;进行语义上相似度精准检测;底层模型以及语料库持续更新集成中;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面兼容Apple......
  • 74_api_intro_text_nlpdetectlanguage
    NLP语种检测API数据接口180+语言检测,语种全称与缩写,返回置信度。1.产品功能基于NLP分析文本的语种支持180+多语种检测;语种缩写遵循ISO639-1标准;包含检测到的语种置信度;毫秒级响应性能;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全......
  • 73_api_intro_text_nlpcorrect
    NLP中文智能纠错API数据接口专注于中文语句智能纠错,基于NLP,多模型参与纠错。1.产品功能秒级NLP智能纠错性能;NLP加载多个模型进行纠错处理;返回纠正字符以及对应位置索引;底层模型以及语料库持续更新集成中;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.......