首页 > 其他分享 >Prompt Perturbation in Retrieval-Augmented Generation based Large Language Models

Prompt Perturbation in Retrieval-Augmented Generation based Large Language Models

时间:2024-04-08 18:33:47浏览次数:38  
标签:RAG Perturbation based Language GGPP 提示 生成 LLM 扰动

本文是LLM系列文章,针对《Prompt Perturbation in Retrieval-Augmented Generation based Large Language Models》的翻译。

基于大语言模型的检索增强生成中的提示扰动

摘要

随着大型语言模型在广泛领域的使用迅速增长,其稳健性变得越来越重要。检索增强生成(RAG)被认为是提高LLM文本生成可信度的一种手段。然而,基于RAG的LLM的输出如何受到略有不同的输入的影响还没有得到很好的研究。在这项工作中,我们发现,即使在提示中插入一个短前缀,也会导致生成远离事实正确答案的输出。我们通过引入一种名为梯度引导提示扰动(GGPP)的新优化技术,系统地评估了这些前缀对RAG的影响。GGPP在将基于RAG的LLM的输出引导到有针对性的错误答案方面实现了高成功率。它还可以处理提示中请求忽略无关上下文的指令。我们还利用LLM在有GGPP扰动和没有GGPP扰动的提示之间的神经元激活差异,提出了一种方法,通过对GGPP生成的提示触发的神经元激活进行高效

标签:RAG,Perturbation,based,Language,GGPP,提示,生成,LLM,扰动
From: https://blog.csdn.net/c_cpp_csharp/article/details/137518083

相关文章

  • 基于项目的协同过滤推荐算法(Item-Based Collaborative Filtering Recommendation Alg
    前言协同过滤推荐系统,包括基于用户的、基于项目的息肉通过率等,今天我们读一篇基于项目的协同过滤算法的论文。今天读的论文为一篇名叫《基于项目的协同过滤推荐算法》(Item-BasedCollaborativeFilteringRecommendationAlgorithms)。摘要Recommendersystemsapplyknowledg......
  • LLM(large language model)知识点
    LLM知识点LLM1.LLM模型,常见的问题有哪些2.llm模型是用原始权重还是自己微调后的模型,如果有微调过,微调过程都存在哪些问题3.BERT的结构?4.怎么使用BERT模型5.Transformer的整体流程:6.Transformer中注意力的作用是什么?7.大模型训练的超参数如何设置?8.InstructGPT三......
  • LeetCode 2468. Split Message Based on Limit
    原题链接在这里:https://leetcode.com/problems/split-message-based-on-limit/description/题目:Youaregivenastring, message,andapositiveinteger, limit.Youmust split message intooneormore parts basedon limit.Eachresultingpartshouldhaveth......
  • Randomness Is All You Need: Semantic Traversal of Problem-Solution Spaces with L
    本文是LLM系列文章,针对《RandomnessIsAllYouNeed:SemanticTraversalofProblem-SolutionSpaceswithLargeLanguageModels》的翻译。随机性就是你所需要的:具有大型语言模型的问题解决空间的语义遍历摘要1引言2相关工作3模型4算法5评估6实现7结论摘......
  • DISTILLM: Towards Streamlined Distillation for Large Language Models
    本文是LLM系列文章,针对《DISTILLM:TowardsStreamlinedDistillationforLargeLanguageModels》的翻译。DISTILLM:面向大型语言模型的流线蒸馏摘要1引言2背景3DISTILLM4实验5分析与讨论6相关工作7结论摘要知识蒸馏(KD)被广泛用于将教师模型压缩为......
  • `.gitattributes` 文件中的 *.js linguist-language=ts *.tsx linguist-language=ts
    .jslinguist-language=ts和.tsxlinguist-language=ts是针对特定文件类型的元数据标记,它们的作用是在特定的上下文中指示这些文件的实际编程语言类型,而非其扩展名所暗示的语言。具体来说:.jslinguist-language=ts表示尽管文件以.js扩展名结尾,但实际上它应该被视为TypeScr......
  • Coursera自然语言处理专项课程04:Natural Language Processing with Attention Models
    NaturalLanguageProcessingSpecializationIntroductionhttps://www.coursera.org/specializations/natural-language-processingCertificateNaturalLanguageProcessingwithAttentionModelsCourseCertificate本文是学习这门课NaturalLanguageProcessing......
  • Html language common symbolic entities
    htmllanguagecommonsymbolicentities一、概述在HTML中,某些字符是预留的。在HTML中不能使用小于号(<)和大于号(>),这是因为浏览器会误认为它们是标签。如果希望正确地显示预留字符,我们必须在HTML源代码中使用字符实体(characterentities)。字符实体类似如下:&entity_name;......
  • Microservice - Distributed Transactions Based on Saga and Kafka in Practice
       ......
  • Autodesk Maya 2025 Multilanguage (macOS, Linux, Windows) - 三维动画和视觉特效软
    AutodeskMaya2025Multilanguage(macOS,Linux,Windows)-三维动画和视觉特效软件三维计算机动画、建模、仿真和渲染软件请访问原文链接:https://sysin.org/blog/autodesk-maya/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.org三维计算机动画、建模、仿真和渲染......