首页 > 其他分享 >大模型调优方法:提示工程、RAGs 与微调对比

大模型调优方法:提示工程、RAGs 与微调对比

时间:2024-01-11 16:33:56浏览次数:24  
标签:提示 模型 微调 RAGs 调优 方法 特定

每一个搭建大语言模型应用的AI工程师都会面临一个难题,如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。如项目需要一个特定结构的应用程序,如预训练缺失上下文的重要文件,再比如有特定术语和结构的高专业性的行业领域,面对这些问题,需要有特定的方法来调整LLM。

 

要决定用哪种调优方法,首先得明白这些方法的含义。

提示工程(Prompt Engineering)

提示工程相对是大家比较熟悉的概念,输入prompt给large language model,大语言模型就根据这个输入来生成回应。然后得到我们想要的结果。这实际上是一种精确的输入方法,旨在引导模型产生相应的输出。大多数情况下prompts指的是文本,尤其是以自然语言来作为描述的文本。

 

检索增强生成(Retrieval Augmented Generation)

RAG技术通常将客户的原有文档切分成很多片段,理解每一个片段的语义并将其保存在数据库中,通过大语言模型理解用户的查询需求,并将相关的片段从数据库中检索出来,将提示工程与数据库查询相结合以获得上下文丰富的答案。达到提升生成内容的精准度。

 

微调(Fine-tuning)

微调和前两个不同的地方在于,前面两种技术,不管是提示工程还是RAG,大模型本身是没有任何的变化的,但是如果做微调,其实是要去通过一个训练的过程来修改大模型它本身的参数,使模型能更加专业化。比如,一个语言模型可以在医学文献上进行微调,从而更擅长回答健康护理相关的问题。

图片来源@Akshay_pachaar

这三种技术在性能、效率和适用范围上各有千秋。选择哪种方法取决于具体的应用需求。

 

当AI应用需求不涉及大量外部知识,且主要依赖模型现有知识库时,提示工程是一个简单有效的选择。提示工程通过设计合适的提示,引导模型生成更符合预期的回答。由于这类应用场景中,模型已经具备足够的知识储备,因此只需通过优化提示,便可实现更好的性能。这种方法适用于各种通用场景,如自然语言生成、对话系统等。

 

在需要引入和利用大量外部知识的场景中,RAG能提供更加丰富和准确的输出,RAG更多的是关于改变知识,而且利用外部知识库来生成答案。通过结合外部知识库,RAGs能够为模型提供更多上下文信息,从而生成更精确、详细的回答。这类方法适用于知识密集型场景,如问答系统、信息抽取等。

 

当AI应用需要在特定领域内表现出高度专业化时,微调是最佳选择,微调主要是关于改变模型的行为,通过训练特定领域的数据,使模型更好地适应特定应用场景。微调能够让模型在特定领域具备更高的准确性和专业性,从而满足领域内复杂、专业的要求。这类方法适用于医疗、金融、法律等特定领域。

 

如果你的应用既需要定制知识又需要改变模型的行为,那么采用混合方案(RAGs + 微调)将是更佳选择。通过结合RAGs和微调,可以在特定领域内实现丰富的知识生成和高度专业化的模型性能。这种混合方案充分发挥了两种方法的优势,使得AI应用在定制知识和行为改变方面达到更高水平。

   

标签:提示,模型,微调,RAGs,调优,方法,特定
From: https://www.cnblogs.com/ai2nv/p/17958847

相关文章

  • XTuner 大模型单卡低成本微调
    微调框架XTuner以及整个微调的工作流程。以InternLM为底座模型来进行微调。 Finetune简介XTuner介绍8GB显卡玩转LLM动手实战成功连接上了开发机。......
  • 个人的vscode配置调优
    简述vscode安装的插件GBKtoUTF8:将GBK编码的文本转换为UTF-8编码GitHubTheme:为VSCode设置GitHub风格的主题MaterialIconTheme:为VSCode设置MaterialDesign风格的图标主题Remote-SSH:允许VSCode连接到远程服务器YAML:YAML文件的语法高亮、代码格式化和其他支持......
  • JVM 21 调优指南:如何进行JVM调优,JVM调优参数
    聊聊关于JVM21的优化指南。这篇文章将会深入探讨如何进行JVM调优,介绍一些关键的JVM调优参数,并提供12个实用的代码示例。由于篇幅较长,我会分几个部分来详细讲解本文已收录于,我的技术网站ddkk.com,有大厂完整面经,工作技术,架构师成长之路,等经验分享JVM调优概览JVM(Java虚拟机)调优是......
  • MoE模型性能还能更上一层楼?一次QLoRA微调实践
    Fine-Tuning Mixtral 8x7B with QLoRA:Enhancing Model Performance ......
  • 你还在“垃圾”调优?快来看看JDK17的ZGC如何解放双手 | 京东云技术团队
    1、前言不要犹豫了,GC最大停顿时间小于1ms,支持16TB内存,这么高的性能提升,也不需要复杂的调优,节省了这个时间,你去陪对象不香嘛。上篇文章给大家带来了JDK11升级JDK17的最全实践,相信大家阅读后对于升级JDK17有了基本的了解。同时我们也会比较好奇,ZGC的原理是啥样的,怎么做到停顿时间......
  • 你还在“垃圾”调优?快来看看JDK17的ZGC如何解放双手 | 京东云技术团队
    1、前言不要犹豫了,GC最大停顿时间小于1ms,支持16TB内存,这么高的性能提升,也不需要复杂的调优,节省了这个时间,你去陪对象不香嘛。上篇文章给大家带来了JDK11升级JDK17的最全实践,相信大家阅读后对于升级JDK17有了基本的了解。同时我们也会比较好奇,ZGC的原理是啥样的,怎么做到停顿时间那么......
  • 【LLM】微调我的第一个WizardLM LoRA
    根据特定用例调整LLM的行为之前,我写过关于与Langchain和Vicuna等当地LLM一起创建人工智能代理的文章。如果你不熟悉这个话题,并且有兴趣了解更多,我建议你阅读我之前的文章,开始学习。今天,我将这个想法向前推进几步。首先,我们将使用一个更强大的模型来与LangchainZeroShotReAct工具......
  • 【积微成著】性能测试调优实战与探索(存储模型优化+调用链路分析)| 京东物流技术团队
    一、前言性能测试之于软件系统,是保障其业务承载能力及稳定性的关键措施。以软件系统的能力建设为主线,系统能力设计工作与性能测试工作,既有先后之顺序,亦有相互之影响。以上,在性能测试的场景决策,架构分析、流量分析、压测实施和剖解调优等主要环节中,引发对于系统能力底盘夯实和测试策......
  • 图像生成模型微调:StyleGAN与BigGAN的实践
    1.背景介绍图像生成模型是深度学习领域中一个热门的研究方向,它旨在生成高质量的图像,以模拟现实世界中的图像或创造出新的虚构图像。在过去的几年里,我们已经看到了许多有趣的图像生成模型,如GAN(GenerativeAdversarialNetworks)、VAE(VariationalAutoencoders)等。然而,在这篇文章中,我......
  • JVM如何线上调优?
    晚上8点是我和们的业务高峰,—到高峰的时候,发现TP8的蚝时会变高,有明显的手剩,通过排查发现内存使用率也会增大,然后再释放,其他各项指标证正常,于是怀疑是GC导致的,观察服务器的GC情况,发现yongGC情况如下,大概每5分钟,GC55次,峰值最高可以达到20次。FiulGC比较频繁,每5分钟大概0.5次,峰值8次......