首页 > 其他分享 >A Comprehensive Evaluation of Sequential Memory Editing in Large Language Models

A Comprehensive Evaluation of Sequential Memory Editing in Large Language Models

时间:2024-04-11 10:30:25浏览次数:28  
标签:ME Language Models Comprehensive 编辑 Sequential LLM Memory Evaluation

本文是LLM系列文章,针对《Navigating the Dual Facets: A Comprehensive Evaluation of Sequential Memory Editing in Large Language Models》的翻译。

双向导航:大型语言模型中顺序记忆编辑的综合评价

摘要

内存编辑(ME)已经成为一种有效的方法来修改错误的事实或将新的事实注入大型语言模型(LLM)。存在两种主流的ME方法:参数修改ME和参数保留ME(在保留原始参数的同时集成额外的模块)。令人遗憾的是,以前关于ME评估的研究有两个关键的局限性:(i)仅用单一编辑

标签:ME,Language,Models,Comprehensive,编辑,Sequential,LLM,Memory,Evaluation
From: https://blog.csdn.net/c_cpp_csharp/article/details/137627207

相关文章

  • embedding models 是什么
    embeddingmodels是一类机器学习模型,它们的核心功能是将高维、离散的输入数据(如词汇、类别标签、节点或实体)映射到低维、连续的向量空间中。这些向量(即embeddings)通常具有丰富的语义信息,并能够捕捉原始数据之间的潜在关系和相似度。以下是对embeddingmodels的详细说明: 1.......
  • 最新语言大模型综述 Large Language Models A Survey
    文章目录摘要I.引言II.大型语言模型A.早期预训练神经语言模型B.大型语言模型家族C.其他代表性LLMsIII.LLM是如何构建的A.主要LLM架构B.数据清洗C.分词D.位置编码E.模型预训练F.微调和指令微调G.对齐H.解码策略I.成本效益的训练/推理/适应/压缩IV.LLM如......
  • YOLO报错AttributeError: Can‘t get attribute ‘SPPF‘ on <module ‘models.common
    解决方案:model/common.py里面去找到这个SPPF的类,把它拷过来到Tags5的model/common.py里面,这样你的代码就也有这个类了,还要引入一个warnings包1、把importwarnings放在上面去:importwarnings2、把SPPF类的代码复制到common.py中classSPPF(nn.Module):#SpatialP......
  • 超级agent的端语言模型Octopus v2: On-device language model for super agent
    大型语言模型(LLMs)在函数调用方面展现出卓越的应用潜力,特别是针对AndroidAPI的定制应用。与那些需要详尽描述潜在函数参数、有时甚至涉及数万个输入标记的检索增强生成(RAG)方法相比,Octopus-V2-2B在训练和推理阶段均采用了独树一帜的功能标记策略。这一创新不仅令Octopus-V2-2B的......
  • Prompt Perturbation in Retrieval-Augmented Generation based Large Language Model
    本文是LLM系列文章,针对《PromptPerturbationinRetrieval-AugmentedGenerationbasedLargeLanguageModels》的翻译。基于大语言模型的检索增强生成中的提示扰动摘要1引言2相关工作3梯度引导的提示扰动4对抗性前缀的检测5实验6结论摘要随着大型......
  • LLM(large language model)知识点
    LLM知识点LLM1.LLM模型,常见的问题有哪些2.llm模型是用原始权重还是自己微调后的模型,如果有微调过,微调过程都存在哪些问题3.BERT的结构?4.怎么使用BERT模型5.Transformer的整体流程:6.Transformer中注意力的作用是什么?7.大模型训练的超参数如何设置?8.InstructGPT三......
  • Randomness Is All You Need: Semantic Traversal of Problem-Solution Spaces with L
    本文是LLM系列文章,针对《RandomnessIsAllYouNeed:SemanticTraversalofProblem-SolutionSpaceswithLargeLanguageModels》的翻译。随机性就是你所需要的:具有大型语言模型的问题解决空间的语义遍历摘要1引言2相关工作3模型4算法5评估6实现7结论摘......
  • DISTILLM: Towards Streamlined Distillation for Large Language Models
    本文是LLM系列文章,针对《DISTILLM:TowardsStreamlinedDistillationforLargeLanguageModels》的翻译。DISTILLM:面向大型语言模型的流线蒸馏摘要1引言2背景3DISTILLM4实验5分析与讨论6相关工作7结论摘要知识蒸馏(KD)被广泛用于将教师模型压缩为......
  • `.gitattributes` 文件中的 *.js linguist-language=ts *.tsx linguist-language=ts
    .jslinguist-language=ts和.tsxlinguist-language=ts是针对特定文件类型的元数据标记,它们的作用是在特定的上下文中指示这些文件的实际编程语言类型,而非其扩展名所暗示的语言。具体来说:.jslinguist-language=ts表示尽管文件以.js扩展名结尾,但实际上它应该被视为TypeScr......
  • Coursera自然语言处理专项课程04:Natural Language Processing with Attention Models
    NaturalLanguageProcessingSpecializationIntroductionhttps://www.coursera.org/specializations/natural-language-processingCertificateNaturalLanguageProcessingwithAttentionModelsCourseCertificate本文是学习这门课NaturalLanguageProcessing......