首页 > 其他分享 >Lookback Lens:用注意力图检测和减轻llm的幻觉

Lookback Lens:用注意力图检测和减轻llm的幻觉

时间:2024-07-14 10:55:02浏览次数:14  
标签:分类器 解码 Lookback Lens 回看 llm 幻觉 上下文 模型

在总结文章或回答给定段落的问题时,大语言模型可能会产生幻觉,并会根据给定的上下文回答不准确或未经证实的细节,这也被称为情境幻觉。为了解决这个问题,这篇论文的作者提出了一个简单的幻觉检测模型,其输入特征由上下文的注意力权重与新生成的令牌(每个注意头)的比例给出。它被称为回看或基于回看比率的检测器。

该方法计算为给定上下文的注意力权重与新生成的令牌的比值。在每个时间步,计算每个注意头的回看率,并训练一个线性分类器,称之为Lookback Lens,根据回看率特征检测上下文幻觉,如下图所示

在解码过程中可以进一步整合该检测器,获得可减少幻觉的回看透镜引导解码策略

幻觉检测

Lookback Lens(回看透镜)

作者引入了回看比例,这是一个基于Transformer模型的注意力分布的度量 给定一个具有L层的Transformer,每层有H个头部,该模型处理一个输入序列的上下文标记X = {x1, x2, . . . , xN},长度为N,然后是一组新生成的标记Y = {y1, y2, . . . , yt−1}来生成下一个标记yt。在时间步t,对于每个头部,计算关注于上下文标记与新生成标记的注意力权重的比例 对于每个头部h在层l中,定义:

其中αl h,i和αl h,j分别是分配给上下文令牌X和新令牌Y的softmax激活的注意力权重

在时间步t的层l中头h的回看比例计算为

将回看比率作为输入特征,通过将所有头部和层的回看比率连接成时间步t的特征向量,用于检测幻觉:

给定一个文本跨度 {yt, yt+1, …, yt+T−1},将相应的回看比率向量 {vt, vt+1, …, vt+T−1} 平均成一个单一向量 ¯v。然后使用逻辑回归分类器 F 基于平均后的回看比率向量来预测该跨度是事实(1)还是幻觉(0)。

其中σ为sigmoid函数,w为权重向量,b为分类器的偏置项。

回看透镜预测跨度上幻觉的概率。作者考虑了以下两种方式来获取给定序列的跨度:

预定义跨度:当幻觉和非幻觉跨度的注释可用时,直接训练分类器来区分它们。

滑动窗口:由于在解码过程中没有预定义的跨度,因此使用滑动窗口设置,遍历所有可能的跨度。具体来说将句子处理成固定大小的块,并训练分类器来预测标签,如果块内存在任何幻觉内容,则预测为0,否则预测为1。

实验设置

下表显示了在NQ (QA)和CNN/DM (Sum.)上使用预定义的跨度分割和滑动窗口(size = 8)的分类任务的AUROC。

Lookback Lens的性能略好于基于隐藏状态的分类器,并且显著优于NLI模型。在滑动窗口设置中,回看镜头相对于基于隐藏状态的分类器的优势更为显著。基于隐藏状态的分类器在二次验证过程中容易出现训练集过拟合的问题,并且在转移到域外任务时表现出明显的性能下降

Lookback Lens虽然并不总是完美地拟合训练集,但在应用于域外任务时始终表现出更好的性能

上下文幻觉缓解

回看透镜引导解码

将回看镜头(F)整合到解码过程中:

F可以评估多个标记块,因为每个块在多个解码步骤中引起不同的注意力模式

给定上下文和部分生成的文本,在相同的解码步骤t独立采样一组k个候选块 {C1,C2, . . . ,Ck}。

对于每个块Cj,相关的回看比率被平均以形成特征向量¯vj

如下图所示,作者选择由F预测的最佳候选C∗并将其添加到生成中

重复此过程,直到生成EOS令牌或达到最大长度

结果

下表显示了在块大小为8的情况下,每个块使用8个候选块的解码结果

回看透镜引导解码可以提高领域内任务(XSum,提高了9.6%)和领域外任务(NQ,提高了3%)的性能。这一结果与使用SoTA NLI(自然语言推理)引导解码的效果相当,其中SoTA NLI在大约731k个注释的摘要示例上进行训练,这比论文的1k训练集大700倍。

由隐藏状态或NLI分类器引导的解码,这两者都是在相同数据上训练的,只能略微提高NQ的性能,但对XSum没有效果,这可能是由于分布偏移的问题,凸显了回看透镜在泛化能力上的优势。解码方法可以在幻觉设置中提高性能,同时保持在原始设置中的相同性能,这表明论文的解码方法在减少幻觉的同时不会影响整体生成质量。

跨模型迁移

使用回看比率捕捉用于幻觉检测的高级模型模式,突出了其在跨模型转移中的潜力。用一个模型的回看比率训练的分类器可以应用到另一个模型而无需重新训练,前提是目标模型的注意力模式与原始模型的注意力模式之间存在相关性。

在注意力图上训练的回看透镜可以从LLaMA-2–7B-Chat转移到LLaMA-2–13B-Chat而无需任何重新训练。下表显示了在检测任务上的跨模型转移结果。

虽然与同一模型迁移相比,跨模型迁移产生的结果略差,但AUROC分数仍然很高。下表显示了使用贪婪解码和分类器引导采样方法(块大小为8)从LLaMA-2-7B-chat到LLaMA-2-13B-chat的交叉模型迁移。

观察到使用13B本身或使用应用于13B解码的SoTA NLI模型进行同模型转移时的性能改善类似。然而,在跨任务+跨模型转移设置中:从CNN/DM(7B)到NQ(13B),我们没有观察到显著的改善,作者将其归因于较大的分布偏移。

限制

回看透镜引导解码的性能上限受到LLM自身采样能力的限制。尽管回看透镜是一个轻量级分类器,具有可以忽略不计的推理时间,但从LLM中采样多个候选者的需求增加了总推理时间。并且回看透镜依赖于大约1k-2k的注释示例来训练分类器。

总结

回看透镜是一个轻量级分类器,通过利用回看比率来检测上下文幻觉,回看比率仅从注意力权重中计算得出。这个分类器不仅有效地识别上下文幻觉,而且还通过从LLM的回看镜头引导解码来缓解它们。该方法可以在不同任务之间转移,甚至在映射其注意力头部后可以跨模型转移。

论文:

https://avoid.overfit.cn/post/0c18bed0b5b0466984c2ff8ec5a70283

标签:分类器,解码,Lookback,Lens,回看,llm,幻觉,上下文,模型
From: https://blog.csdn.net/m0_46510245/article/details/140374176

相关文章

  • Tensor-LLM简单介绍
    最近体验了一下英伟达的TensorRT-LLM的最新版本,写个简单介绍,给大家参考。TensorRT-LLM是专门用于大语言模型推理和部署的产品,同类型产品还有来自UC-Berkley的vLLM,上海人工实验室的LMDeploy,英特尔的OpenVINO。英特尔的OpenVINO,可以查看我另一篇文章:如何使用OpenVINO进行A......
  • Phospho:LLM应用的文本分析利器
    今天向大家介绍phospho文本分析平台,专门为大型语言模型(LLM)应用程序设计。它可以帮助开发者从用户或应用程序的文本消息中检测问题、提取洞见、收集用户反馈,并衡量成功。作为一个开源项目,phospho允许开发者查看和修改源代码,以满足特定的需求。phospho平台的灵活性体现在其日志......
  • 分享 LLM 大语言模型算法特训 带你转型 AI 大语言模型算法工程师
    摘要本文旨在探讨大型语言模型(LargeLanguageModel,LLM)的进化路线,重点分析其领域微调技术的发展以及这些模型在自然语言处理(NaturalLanguageProcessing,NLP)中的应用范式。通过文献综述、技术分析和案例研究,本文详细阐述了LLM如何从统计语言模型发展到基于Transform......
  • Meta MobileLLM
      每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://......
  • 王牌站士Ⅱ--针对 LLM/SLM 的高级 RAG
    前言检索增强生成(RAG)已成为一种增强语言模型能力的强大技术。通过检索和调整外部知识,RAG可让模型生成更准确、更相关、更全面的文本。RAG架构主要有三种类型:简单型、模块化和高级RAG:NaiveRAG采用GPT-3这样的单片模型,并简单地根据检索到的证据段落对其进行条件化......
  • 王牌站士Ⅲ--监控 LLM 行为的方法
    前言GPT-4、LLaMA-2、Claude等大型语言模型(LLM)在生成类似人类的文本和进行智能对话方面表现出了巨大的潜力。然而,随着这些模型变得越来越强大,人们越来越需要监控它们的行为,以防止出现偏见、毒性和事实错误等问题。现在让我们探讨与监控LLM相关的以下主题:不受控制的大......
  • 关于SVD-LLM的应用-基于SVD量化
    关于SVD-LLM的应用-基于SVD量化一背景论文连接:https://arxiv.org/pdf/2403.07378这是论文github:https://github.com/AIoT-MLSys-Lab/SVD-LLM 二什么是SVD SVD可能是可以把矩阵向量转化到另外一个空间角度,以方便数据处理。2.1概念SVD(Singular......
  • 【 2024!深入了解 大语言模型(LLM)微调方法(总结)】
    文末有福利!引言众所周知,大语言模型(LLM)正在飞速发展,各行业都有了自己的大模型。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。那么,今天这篇文章就带大家深入了解大模型微调。其中主要......
  • Lookback Lens:用注意力图检测和减轻llm的幻觉
    在总结文章或回答给定段落的问题时,大语言模型可能会产生幻觉,并会根据给定的上下文回答不准确或未经证实的细节,这也被称为情境幻觉。为了解决这个问题,这篇论文的作者提出了一个简单的幻觉检测模型,其输入特征由上下文的注意力权重与新生成的令牌(每个注意头)的比例给出。它被称为回......
  • AI推介-大语言模型LLMs之RAG(检索增强生成)论文速览(arXiv方向):2024.06.20-2024.07.01
    文章目录~1.AStudyonEffectofReferenceKnowledgeChoiceinGeneratingTechnicalContentRelevanttoSAPPhIREModelUsingLargeLanguageModel2.FromRAGtoRICHES:RetrievalInterlacedwithSequenceGeneration3.SK-VQA:SyntheticKnowledgeGeneration......