首页 > 其他分享 >吴恩达最新短课,知识很硬核,附中英字幕

吴恩达最新短课,知识很硬核,附中英字幕

时间:2023-12-06 11:46:12浏览次数:30  
标签:检索 RAG 吴恩达 上下文 相关性 LLM 短课 硬核

吴恩达最新短课,知识很硬核,附中英字幕

简介

大家好我是老章,吴恩达老师忠实粉丝

之前刷过他的很多课程:

吴恩达新课,1.25倍速刷完了

给吴恩达的最新短课加了中英文字幕

最近吴老师又限时免费开放了一个短课:《构建和评估高级 RAG 应用程序》

该课程由由 llama_index 和 truera_ai的 jerryjliu0和 datta_cs 教授主讲,门槛很低,有 Python 基础知识即可学习。

官网没有中文字幕,所以我用ai翻译并重新压制了中英文字幕版上传B站了

https://www.bilibili.com/video/BV1Cu4y1g7gG/

课程主题

本短课预计需要2个小时可以学完,内容包括:

  • 学习句子窗口检索等方法。

  • 了解评估最佳实践以简化流程,并迭代构建强大的系统。

  • 深入研究 RAG 三元组来评估LLM回答的相关性和真实性:上下文相关性、接地性和答案相关性。

  • 句子窗口检索和自动合并检索,不仅检索最相关的句子,还检索围绕该句子的句子窗口,以获得更高质量的上下文,将 RAG 管道的性能提高到基线以上。

  • 自动合并检索,将文档组织成分层树结构,其中每个父节点的文本在其子节点之间分割。根据子节点与用户查询的相关性,这可以让您更好地决定是否应将整个父节点作为上下文提供给 LLM。

  • 用于单独评估 RAG 关键步骤质量(上下文相关性、答案相关性、接地性)的评估方法,以便您可以执行错误分析,确定管道的哪一部分需要工作,并系统地调整组件。

课程配套完整的代码和视频讲解:

RAG是什么?

当前大模型的问题是其训练数据极其广泛,当我们让其完成特定领域的特定问题时,其回答可能存在事实不准确(幻觉)情况。针对特定问题进行微调可以一定程度上解决问题,但是成本高昂。检索增强生成(RAG)应运而生,RAG是为LLM提供来自外部知识源附加信息的概念,这使它们能够生成更准确和更符合上下文的答案,同时减少幻觉。

普通 RAG 工作流程如下图所示:

检索增强生成 (RAG) 工作流程,从用户查询到使用矢量数据库检索,再到提示填充并最终生成响应。

  1. 检索:用户查询用于从外部知识源检索相关上下文。为此,使用嵌入模型将用户查询嵌入到与向量数据库中的附加上下文相同的向量空间中。这允许执行相似性搜索,并返回矢量数据库中最接近的前 k 个数据对象。
  2. 增强:用户查询和检索到的附加上下文被填充到提示模板中。
  3. 生成:最后,检索增强提示被馈送到 LLM。

开发RAG应用有多种技术路线,这个课程使用了OpenAI嵌入模型在 Python 中实现 RAG 管道,使用TruLens做语言模型应用评估,LlamaIndex做编排。四个章节,配套完整代码,一步一步实现RAG 应用程序。

有志于从事大模型开发的同学,学起来吧。

标签:检索,RAG,吴恩达,上下文,相关性,LLM,短课,硬核
From: https://www.cnblogs.com/jpld/p/17879153.html

相关文章

  • 《满江红》为什么这样“红”?揭秘华为视频AiMax背后的硬核技术
    近日,华为视频AiMax影视品鉴会第一期在华为旗舰店·深圳万象天地举行。在现场,华为视频业务部部长及产品总监、《毒舌电影》主编“硬核卡子”和现场观众共同探讨了《满江红》为什么这样“红”,一同揭秘了AiMax影院级观影体验背后的技术内核。 据华为视频业务部部长介绍,华为视频Ai......
  • TypeScript版的吴恩达的机器学习课程练习-2
    这几天看完了逻辑回归相关的课程,听着的时候感觉还算顺利,但是在进行课程练习的过程中还是花费了较长的时间,因为我画出的图形和实际出题题目后面的图形有点不太一样,所以来来回回不断地调整参数。后面才发现和学习速度α以及梯度下降次数有很大的关系。模型实现具体的模型推到就不说了......
  • 程序员的硬核浪漫 — 女友专属语聊房(内附源码)
    ​ 人人都说找个程序猿做男朋友就是好,钱多话少over早。额。。。估计小编把文章发布出去后就要被公司的程序猿同胞们疯狂逮捕挨打了。虽然日常生活中大家对程序猿的标签大多是呆板、木讷、不懂浪漫,格子衫牛仔裤和黑框眼镜,整天宥与Coding(脱发),哪怕是红酒蜡烛鲜花围绕,一个告警也......
  • 吴恩达深度学习笔记
    B站看的视频,课太长了,180多节,但搬运的没有作业练习,最好找个能练习的 1,假设模型时,以前(2011版机器学习)用西塔代表参数组成的向量,现在用w代表参数组成的向量,b代表西塔0,x还是特征与样本组成的矩阵。目的还是求系数w,进而确定模型。比较一个样本的预测结果与实际结果的函数,是损失函......
  • Linux 爱好者线下沙龙:LLUG 2023 深圳硬核来袭 | 第三站
    导读:2023年9月24日下午,我们将在深圳举行LLUG2023·深圳场。本文转自Linux中国,以下为本次活动介绍。本文字数:1629,阅读时长大约:2分钟经历过 6月北京场、7月上海场,一个月的休整之后,这次LLUG来到大陆的南端,美丽的鹏城。2023年9月24日下午,我们将在深圳举行LLUG2......
  • Linux 爱好者线下沙龙:LLUG 2023 深圳硬核来袭 | 第三站
    导读:2023年9月24日下午,我们将在深圳举行LLUG2023·深圳场。本文转自Linux中国,以下为本次活动介绍。本文字数:1629,阅读时长大约:2分钟经历过 6月北京场、7月上海场,一个月的休整之后,这次LLUG来到大陆的南端,美丽的鹏城。2023年9月24日下午,我们将在深圳举行LLUG20......
  • 万字长文深度解读Java线程池,硬核源码分析
    前言本文将深入分析Java线程池的源码,包括线程池的创建、任务提交、工作线程的执行和线程池的关闭等过程。通过对线程池源码的解析,我们能够更好地理解线程池的原理和机制,为我们在实际开发中合理使用线程池提供指导。文章内容较长,建议找个安静的环境慢慢细读,由于线程池涉及的内容......
  • 硬核!2023版Android面试指南,涵盖Android所有核心技能
    前言今年能明显感受到各行各业的不景气,互联网行业也是首当其冲。最近,大家反馈面试越来越难了,面试八股文也考察的越来越细,越来越底层,面试机会也肉眼可见的变少。这里,给大家总结一下面试小技巧!面试没准备好,不要随便面试,一些大厂都会有面试评价记录,太多差评影响以后的面试,同时面完之后......
  • VFP硬核常考知识点
    1,(数据库的发展与展现出的优点)   三个阶段:人工----->文件----->数据库   几个优点(未找完):          1,文件不能解决数据冗余和数据独立性问题,而数据库系统可以解决      2,(三种数据库类型) (1)层次型数据库(2)网状型数据库 (3) 关系......
  • 吴恩达机器学习2011版本学习笔记
    这是看完视频后,按自己的理解做了笔记。监督学习学的比较认真,33之后的无监督学习心态已经浮躁了,以后要再学一遍2022最新版视频课。1,有正确答案是有监督学习,反之是无监督学习2,模型就是把训练数据拟合为一个公式(严格来说是个函数,关系)。入门的拟合的方法是最小二乘法,先假设一个公式,......