微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

时间：2024-05-29 10:56:11浏览次数：28

大型语言模型(llm)是在巨大的文本语料库上训练的，在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中，然后可以在需要时使用。这些模型的知识在培训结束时被“具体化”。在预训练结束时，模型实际上停止学习。

对模型进行对齐或进行指令调优，让模型学习如何充分利用这些知识，以及如何更自然地响应用户的问题。但是有时模型知识是不够的，尽管模型可以通过RAG访问外部内容，但通过微调使模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的事实知识并将其整合到参数中。

https://avoid.overfit.cn/post/21daac41f99042be804b381a6a9700fb

标签：学到,微调,llm,模型,知识,LLM,幻觉
From： https://www.cnblogs.com/deephub/p/18219726

LLM 大模型学习必知必会系列(九)：Agent微调最佳实践，用消费级显卡训练属于自己的Agent！
LLM大模型学习必知必会系列(九)：Agent微调最佳实践，用消费级显卡训练属于自己的Agent！SWIFT支持了开源模型，尤其是中小型模型（7B、14B等）对Agent场景的训练，并将loss-scale技术应用到agent训练中，使中小模型APICall能力更稳定，并支持使用单张商业级显卡进行Agent推理和部署，可以直接在生......
LLM 大模型学习必知必会系列(六)：量化技术解析、QLoRA技术、量化库介绍使用（AutoGPTQ、A
LLM大模型学习必知必会系列(六)：量化技术解析、QLoRA技术、量化库介绍使用（AutoGPTQ、AutoAWQ）模型的推理过程是一个复杂函数的计算过程，这个计算一般以矩阵乘法为主，也就是涉及到了并行计算。一般来说，单核CPU可以进行的计算种类更多，速度更快，但一般都是单条计算；而显卡能进行的都是基......
LLM 大模型学习必知必会系列(七)：掌握分布式训练与LoRA/LISA微调：打造高性能大模型的秘
LLM大模型学习必知必会系列(七)：掌握分布式训练与LoRA/LISA微调：打造高性能大模型的秘诀进阶实战指南1.微调（SupervisedFinetuning）指令微调阶段使用了已标注数据。这个阶段训练的数据集数量不会像预训练阶段那么大，最多可以达到几千万条，最少可以达到几百条到几千条。指令微调可以......
LLM 大模型学习必知必会系列(四)：LLM训练理论篇以及Transformer结构模型详解
LLM大模型学习必知必会系列(四)：LLM训练理论篇以及Transformer结构模型详解1.模型/训练/推理知识介绍深度学习领域所谓的“模型”，是一个复杂的数学公式构成的计算步骤。为了便于理解，我们以一元一次方程为例子解释：y=ax+b该方程意味着给出常数a、b后，可以通过给出的x求出......
LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践
LLM大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践1.多模态大模型推理LLM的推理流程：多模态的LLM的原理：代码演示：使用ModelScopeNoteBook完成语言大模型，视觉大模型，音频大模型的推理环境配置与安装以下主要演示的模型推理代码可在魔搭社区免费实例PAI-DSW......
RALLM 检索增强LLM架构
importcopyimportosimportsysdir_path=os.path.dirname(os.path.realpath(__file__))sys.path.insert(0,dir_path)importcontextlibimporttorch.utils.checkpointfromtorch.nnimportLayerNormfromtorchimportnnfromtorchvisionimporttransforms......
NOI模拟排序幻觉
涉及知识点：二进制，贪心题意给一个数组\(a[1],a[2],\ldots,a[n]\)，选择一个数\(b\)，如果\(b\)满足：\[(a[1]\oplusb)\leq(a[2]\oplusb)\leq\ldots\leq(a[n]\oplusb)\]则称\(b\)是数组\(a\)的幻数。有\(q\)次询问，每次永久修改一个数。对于原数组与每次询问后......
[论文笔记] The Fact Selection Problem in LLM-Based Program Repair
Introduction:当bug发生时，我们会拿到很多信息：上下文、报错信息等等，文章把这些东西定义为facts，自然产生一个问题：“哪种facts应该被组织进prompt？”这篇文章就这一点做出了一些探讨。之前的工作研究了很多独立的信息，比如上下文、GitHubissue（这也行？）、栈跟踪信息；这篇文章将它......
解密Prompt系列30. LLM Agent之互联网冲浪智能体
这一章我们介绍能自主浏览操作网页的WebAgent们和相关的评估数据集，包含初级任务MiniWoB++，高级任务MIND2WEB，可交互任务WEBARENA，多模态WebVoyager，多轮对话WebLINX，和复杂任务AutoWebGLM。MiniWoB++数据集ReinforcementLearningonWebInterfacesusingWorkflow-GuidedExplora......
大语言模型LLM 相关知识汇总
大型语言模型（LLM）在设计和应用时需要遵守一系列的道德和法律标准，以确保不会输出不当内容。以下是一些LLM通常不应该对外输出的内容类型：个人隐私信息：包括但不限于个人身份信息（PII），如姓名、地址、电话号码、电子邮件地址、社会安全号码等。敏感数据：任何可能涉及国家安全、商业......

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

相关文章

赞助商

阅读排行