首页 > 其他分享 >RAFT:一种适应特定领域RAG的大模型训练新方法!

RAFT:一种适应特定领域RAG的大模型训练新方法!

时间:2024-10-23 10:45:35浏览次数:3  
标签:RAG AI 模型 学习 文档 RAFT

对大量文本数据的语料库进行大型语言模型(LLMs)的预训练已经成为一种标准范式。当将这些LLMs用于许多下游应用时,通常还会通过基于RAG的提示或微调,将新知识(例如,时效性新闻或私有领域知识)额外融入预训练模型中。然而,模型获取这些新知识的最优方法论仍然是一个开放的问题。在此背景下,提出了检索增强微调(RAFT),这是一种训练方法,可以提高模型在“开卷”的特定领域环境中回答问题的能力。

前排提示,文末有大模型AGI-CSDN独家资料包哦!

如何最好地为考试做准备?(a) 基于微调的方法通过直接“记忆”输入文档或在不引用文档的情况下回答练习QA来实现“学习”。(b) 另一方面,上下文检索方法未能利用固定领域所提供的学习机会,等同于在没有学习的情况下参加开卷考试。虽然这些方法利用了领域内的学习,但它们未能为开卷考试做好准备。相比之下,© RAFT在模拟的不完美检索环境中引用文档,同时利用问题-答案对进行微调——从而有效地为开卷考试设置做好了准备。

RAFT通过结合检索增强生成(RAG)和监督式微调(SFT),训练模型忽略那些对回答问题没有帮助的文档(称为干扰文档),并引用相关文档中正确的序列来回答问题。这种方法还包括链式思维(Chain-of-Thought)风格的响应,以增强模型的推理能力。

RAFT的核心思想是在训练数据中包含问题(Q)、一组文档(Dk)和从其中一个文档(D*)生成的答案(A*),其中区分了Golden文档(包含答案的文档)和干扰文档。在训练过程中,模型被训练以在存在干扰文档的情况下,从提供的文档和问题中生成答案。RAFT的训练方法不仅使模型能够通过微调学习特定领域的知识,还确保了对不准确检索的鲁棒性。

RAFT方法概述, 左上角的图表展示了提出的方法,即让大型语言模型(LLMs)适应从一组正面和负面文档中阅读解决方案,这与标准的RAG设置形成对比,在标准的RAG设置中,模型是基于检索器的输出进行训练的,这种输出是记忆和阅读的混合体。在测试时,所有方法都遵循标准的RAG设置,提供上下文中检索到的前k个文档。

实验结果表明,RAFT在PubMed、HotpotQA和Gorilla数据集上的性能一致优于监督式微调模型,无论是使用RAG还是没有使用RAG。

不同数据集上评测结果

RAFT与DSF的比较示例: 在HotpotQA数据集上对RAFT和DSF微调模型进行了提示,可以看到DSF模型从上下文中提取了错误的信息。对于“谁是编剧”的问题,它回答了一个电影的名字。而RAFT成功地正确得出了结果。

RAFT: Adapting Language Model to Domain Specific RAG``https://arxiv.org/pdf/2403.10131.pdf``https://github.com/ShishirPatil/gorilla/tree/main/raft

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:RAG,AI,模型,学习,文档,RAFT
From: https://blog.csdn.net/aolan123/article/details/143178485

相关文章

  • 【上传一张照片,定制程序员科技感写真】函数计算一键部署 PuLID for FLUX大模型
    在这个属于代码世界的节日里,我们为你准备了一份特别的礼物,不论你是前端大牛,还是后端高手;无论是数据分析师,还是算法工程师,只需一张图片,创下你与代码共舞的瞬间,一键生成专属于你的超写实程序员写真!10月21日—11月29日,三步轻松完成体验,即可获得精美电脑包,(活动期间每个工作日限量30个......
  • 计算机毕业设计Python+大模型知识图谱中华古诗词可视化 古诗词智能问答系统 古诗词数
    温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!开发技术:前端:vue.jsechartsD3.js后端:Flask/Django机器学习/深度学习:LSTM情感分析模型、PyTorch、T......
  • 计算机毕业设计Spark+大模型动漫推荐系统 动漫视频推荐系统 漫画分析可视化大屏 漫画
    《Spark+大模型动漫推荐系统》开题报告与任务书一、引言随着互联网技术的飞速发展,动漫产业的数据量急剧增长。用户面临着海量动漫作品的选择难题,如何从这些数据中高效地提取有价值的信息,为用户推荐符合其喜好的动漫作品,成为当前动漫产业亟需解决的问题。基于Spark的大数据处......
  • TriLib2:Unity运行时运行时加载模型
    概述本文基于此版本TriLib2是Unity的一款强大的3D模型运行时导入工具包,可以在游戏运行期间或编辑器中动态加载多种格式的模型,笔者也只是简单使用了从文件路径加载模型一种用法,旨在帮助你快速入门.它支持的格式包括FBX、OBJ、GLTF2、STL、PLY、3MF、DAE和ZIP等,......
  • 基于FFT + CNN - BiGRU-Attention 时域、频域特征注意力融合的电能质量扰动识别模型
    往期精彩内容:Python-电能质量扰动信号数据介绍与分类-CSDN博客Python电能质量扰动信号分类(一)基于LSTM模型的一维信号分类-CSDN博客Python电能质量扰动信号分类(二)基于CNN模型的一维信号分类-CSDN博客Python电能质量扰动信号分类(三)基于Transformer的一维信号分类模型-......
  • 多特征变量序列预测(二)——CNN-LSTM-Attention风速预测模型
    往期精彩内容:时序预测:LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较全是干货|数据集、学习资料、建模资源分享!EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现(一)EMD-CSDN博客EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现(二)EEMDEMD、EE......
  • 轴承故障诊断 (12)基于交叉注意力特征融合的VMD+CNN-BiLSTM-CrossAttention故障识别模
    往期精彩内容:Python-凯斯西储大学(CWRU)轴承数据解读与分类处理Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客三十多个开源数据集|故障诊断再也不用担心数据集了!P......
  • 三周精通FastAPI:7 查询参数模型
    查询参数模型如果你有一组相关的查询参数,你可以创建一个Pydantic模型来声明它们。这将允许您在多个地方重用模型,并一次声明所有参数的验证和元数据。......
  • 开源表格识别模型对比
    引言表格结构识别功能是智能文档中很重要的一个模块,又加之表格种类繁多,且复杂,又进一步让表格识别任务变得更加困难。现阶段,开源的表格识别模型众多,但却难以有一个公平的对比,来方便我们在日常使用时选择合适的模型。因此,我们就以此为出发点,旨在解决评估开源表格模型评估问题,通过......
  • 网络安全人员必知的35个安全框架及模型
    一、概括网络安全专业机构制定的一套标准、准则和程序,旨在帮助组织了解和管理面临的网络安全风险。优秀的安全框架及模型应该为用户提供一种可靠方法,帮助其实现网络安全建设计划。对于那些希望按照行业最佳实践来设计或改进安全策略的组织或个人来说,网络安全框架及模型是不可......