首页 > 其他分享 >大模型RAG面试高频知识点

大模型RAG面试高频知识点

时间:2024-11-23 16:32:50浏览次数:10  
标签:检索 知识点 RAG AI 模型 微调 学习 高频

看到很多同学对RAG比较感兴趣,但是在面试中被问麻了,不知道如何突出自己的能力。就跟之前做GBDT、BERT和LLM微调一样,我们做的不仅仅是算法本身,而是解决问题的项目方案。

请添加图片描述

让大家恨不得在简历上删除的RAG项目,大致有以下几个特点:
1、demo简单:RAG易学难精,搭建一个demo非常简单,但是问到如何优化对很多人来说非常困难。大部分RAG项目的流程高度相似,检索(混搜+重排)+生成(LLM、基座微调)。教程类的demo+效果不佳,这种简历会被直接pass。
2、not focus on检索:对于RAG来说检索的重要性远高于大模型本身的能力。没有做过混合检索和重排的项目,过初筛都很困难。如果不对输入query进行意图识别,无差别扔给大模型,就会显得简单粗暴。
3、依赖知识库:很多RAG项目都是在做问答系统,就跟搜索一样,非常依赖底层数据。如果数据量不够丰富,是检索不到任何东西的,巧妇难为无米之炊。

请添加图片描述

如何突出自己的RAG亮点,下面给大家整理了几个高频知识点

1、数据源:FQAs问答、客服咨询、产品说明书、行业政策、内部文档、行业报告、相关手册等
2、文档解析:文本、图片、表格、标题、公式等识别方法,PDF、Word、Excel、PPT、Html等文件解析
3、知识库构建:chunk_size切块方法优化、对比学习embedding模型微调、信息抽取的索引方式优化
4、文档检索:向量、ES、联网等检索方法,融合检索(TSF和query回退)和递归检索(chunk链接方式)两种策略
5、模型微调:基于文档的数据集生成、知识库数据集构建方法、基座模型微调
6、效果评估:groud-turth的测试集,关键词、bert语义、ragas的评估方法,问答、多轮对话等业务评估策略~

在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

标签:检索,知识点,RAG,AI,模型,微调,学习,高频
From: https://blog.csdn.net/2401_85375151/article/details/143994365

相关文章

  • vue.js学习知识点(汇总)
     Vue是什么?Vue是一个用于构建用户界面的渐进式框架1.构建用户界面:基于数据动态渲染页面2.渐进式:循序渐进的学习3.框架:一套完整的项目解决方案,提升开发效率↑(理解记忆规则)   规则→官网创建Vue实例,初始化渲染的核心步骤1.准备容器2.引包(......
  • 大模型面试——做RAG的211硕士,面了一个做RAG的211硕士,讲不清知识库构建
    RAG目前属于比较成熟的大模型落地技术,一般以PDF文档、excel、nl2sql和联网检索作为数据来源。今天面的这位同学主要做智能客服业务,利用历史多轮对话QA作为知识库。之前在面RAG项目的时候的时候,大部分都会去问知识库的数量,文档解析效果和chunk切分逻辑。他们以上千条历史多......
  • pragma comment的使用
    #pragma的使用尽管C和C++都已经有标准,但是几乎每个编译器(广义,包含连接器等)扩展一些C/C++关键字。合理地应用这些关键字,有时候能使我们的工作非常方便。下面随便说说VisualC++中#pragma指示符的使用。一、用#pragma导出DLL函数    传统的到出DLL函数的......
  • JavaWeb知识点总结 我的学习笔记
    JavaWeb我的学习笔记一、动态网页开发1.动态网页2.系统架构C/S架构B/S架构B/S与C/S的比较3.URL通信三要素4.Tomcat服务器二、Servlet1.Servlet简介2.Servlet快速入门入门样例执行原理3.Servlet的体系结构4.servlet的十大方法5.Servlet生命周期6.在web.xml中配置servl......
  • CAD知识点概览 CAD数据交换与二次开发
    CAD知识点概览章节目录一、CAD基础概念与应用领域二、CAD软件界面与基本操作三、二维绘图与编辑四、尺寸标注与文字标注五、三维建模与编辑六、视图显示控制与打印输出七、图层管理与数据库管理八、CAD数据交换与二次开发九、CAD学习方法与资源推荐一、CAD基础概念与应用......
  • Springboot知识点总结
    一、传统使用配置文件方式创建Java对象:1、创建一个普通的Maven项目,并加入依赖:<dependency><groupId>org.springframework</groupId><artifactId>spring-context</artifactId><version>5.3.1</version></dependency>&......
  • 【RAG系列】基于代码仓库的RAG问答,为仓库构建知识图谱
    目录前言一、为什么要在代码仓库上构建知识图谱二、如何在代码仓库上构建知识图谱简单的知识图谱更高级的知识图谱总结Reference前言今天介绍的场景是基于代码仓库的RAG问答,RAG有效的关键在于能够根据用户查询检索到相关的文档,这中间涉及到索引构建和文档检索两......
  • 2024-10-23:最高频率的 ID。用go语言,给定两个长度相等的整数数组 nums 和 freq, 其中num
    2024-10-23:最高频率的ID。用go语言,给定两个长度相等的整数数组nums和freq,其中nums中的每个元素表示一个ID,而freq中的每个元素表示对应ID在此次操作后出现的次数变化。如果freq[i]为正数,则表示在这次操作中nums[i]的ID会增加freq[i]次;如果freq[i]为负数,则表示在这次操作中nums[i......
  • 一文读懂RAG和LLM微调,教你结合业务场景落地LLM应用
    随着大家对大型语言模型(LLM)的兴趣激增,许多开发者也在构建基于LLM的应用。当直接使用Prompt驱动的LLM表现不如预期时,问题就出现了:如何提高LLM应用的可用性。这时我们需要权衡:是选择检索增强生成(Retrieval-AugmentedGeneration缩写RAG)还是模型微调来改善结果?01在深入探......
  • Linux常用命令大全超详细知识点概览
    我是小粥学姐,下面是Linux常用命令大全哦,先上目录。章节目录一、文件和目录管理命令二、文件内容查看与编辑命令三、文件搜索与查找命令四、系统管理与监控命令五、网络管理与通信命令六、用户管理与权限设置命令七、打包压缩与备份命令八、其他实用命令一、文件......