视频地址:https://www.bilibili.com/video/BV1QA4m1F7t4
文档地址:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/readme.md
作业地址:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/homework.md
茴香豆项目地址: https://github.com/InternLM/HuixiangDou
RAG 概述
RAG(Retrieval Augmented Generation)技术,通过检索与用户输入相关的信息片段,并结合外部知识库来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成本、实现外部记忆。
RAG工作原理
- 索引知识源,如文档、网页等,将其编码为向量存入向量数据库。
- 用户问题同样编码为向量,并在向量数据库中检索相关信息。
- 结合检索结果和用户问题作为提示,生成最终回答。