- 2025-01-17超越 RAG:Memobase 为 AI 应用注入长期记忆丨社区来稿
本文由RTE开发者社区成员通过社区网站投稿提供,如果你也有与实时互动(Real-TimeEngagement,RTE)相关的项目分享,欢迎访问网站rtecommunity.dev发布,优秀项目将会在公众号发布分享。目录什么是AI记忆? AI记忆的类型 短记忆vs.长记忆UserMemoryvs.AgentMemory:两种
- 2025-01-16一文读懂:大模型RAG(检索增强生成)含高级方法
RAGRAG检索增强生成(RetrievalAugmentedGeneration),已经成为当前最火热的LLM应用方案。理解不难,就是通过自有垂域数据库检索相关信息,然后合并成为提示模板,给大模型生成漂亮的回答。业界不知道大模型的基本没有,大家对大模型的能力也有一定的了解,但是当我们将大模型应用于实际
- 2025-01-15【RAG框架】蚂蚁开源新RAG框架KAG,可达91%准确率
本文探一探蚂蚁开源的另外一套知识增强生成框架KAG(KnowledgeAugmentedGeneration),专门用于构建垂直领域知识库的逻辑推理问答框架,论文中提到在电子政务达到了91.6的准确率,电子医疗各个问答也有不俗的准确率。本文会简单的介绍一下KAG的概念和构建流程,然后尝试在本地启动KA
- 2025-01-15AI应用开发先了解这些概念:智能体、LLM、RAG、提示词工程
什么是智能体(Agent)一种基于LLM(LargeLanguageModel)的能够感知环境、做出决策并执行行动以实现特定目标的自主系统。与传统人工智能不同,AlAgent模仿人类行为模式解决问题,通过独立思考和调用工具逐步完成给定目标,实现自主操作。通用智能体平台以Agent为核心技术驱动,
- 2025-01-15Agentic RAG 系统的崛起
探秘智能检索新境界:AgenticRAG系统的崛起
- 2025-01-15构建本地知识库:基于 LangChain 和 Ollama 的 RAG 实现教程
构建本地知识库:基于LangChain和Ollama的RAG实现教程简介在这个教程中,我们将学习如何构建一个本地运行的知识库系统,它能够让用户上传PDF或TXT文档,并通过自然语言与文档内容进行交互。这个系统使用了RAG(检索增强生成)技术,结合了LangChain、Ollama和Streamlit
- 2025-01-14AI大模型学习路径:适合每个人的详细步骤与技巧!
23年AI大模型技术狂飙一年后,24年AI大模型的应用已经在爆发,因此掌握好AI大模型的应用开发技术就变成如此重要,那么如何才能更好地掌握呢?一份AI大模型详细的学习路线就变得非常重要!由于AI大模型应用技术比较新,业界也没什么参照标准,打造AI大模型技术的学习路线并非
- 2025-01-14【向量数据库】搭建RAG架构,如何选择向量数据库产品?
搭建RAG架构应用时,选择合适的向量数据库是关键。向量数据库是RAG系统的核心组件,负责存储和检索高维向量数据,从而支持高效的语义搜索和信息检索功能。那么今天与大家分享下如何选择向量数据库,以及主流向量数据库产品的推荐,供您参考学习。如何选择向量数据库?性能与延迟:向量数据库
- 2025-01-13借助 LangGraph、OpenAI 和 Tavily 构建自适应 RAG 系统(含代码)
自适应RAG系统(Multi-AgenticRAG:探索智能问答系统的新边界(含代码))是一种能够根据用户查询的具体语境,动态选择检索策略与生成方式的人工智能系统。它结合了先进的自然语言处理技术和信息检索算法,能够在海量数据中快速定位相关信息,并基于这些信息生成准确、连贯的回答。LangGraph
- 2025-01-13TrustRAG:增强RAG系统鲁棒性与可信度的创新框架
在人工智能飞速发展的今天,大语言模型(LLMs)凭借其强大的语言处理能力在诸多领域大放异彩。检索增强生成(RAG)系统(面向企业RAG(RetrievalAugmentedGeneration)系统的多维检索框架)的出现,通过整合外部知识源进一步提升了LLMs的性能,使其能针对用户查询提供更准确、更具上下文相关性的
- 2025-01-12RAG中的文本切分策略详解
RAG中的文本切分策略详解1.选择RAG中的文本切分策略1.1不同的文本切分策略1.CharacterTextSplitter-这是最简单的方法。它默认基于字符(默认为"")来切割,并且通过字符的数量来衡量块的长度2.RecursiveCharacterTextSplitter-基于字符列表拆分文本。3.-基
- 2025-01-12【Docker】Docker搭建一款开源的RAG聊天应用
项目介绍Kotaemon是一个由Cinnamon开发的开源项目,旨在提供一个基于检索增强生成(RAG)技术的用户界面,使用户能够与自己的文档进行交互问答。功能特点文档问答:Kotaemon允许用户通过自然语言查询与文档进行交互,快速获取所需信息。这一功能在学术研究、企业文档管理等领域具有广泛应
- 2025-01-11使用 MongoDB 和 OpenAI 实现 RAG 的实战指南
在本篇文章中,我们将深入探讨如何使用MongoDB和OpenAI实现检索增强生成(RAG,Retrieve-AugmentedGeneration)。通过结合数据库的高效检索能力和语言模型的生成能力,可以创建出功能强大的应用。接下来,我们将详细介绍如何搭建这样的系统,并提供可运行的代码示例。技术背景介绍
- 2025-01-11使用RAG与LanceDB和OpenAI构建智能应用
在现代AI应用中,结合现有知识库与生成式AI模型进行信息检索与生成(RAG)正变得愈加重要。本文将指南特如何通过LanceDB和OpenAI实现RAG,帮助开发者快速搭建智能应用。技术背景介绍LanceDB是一个高效、面向AI的数据库,能够存储和检索大量向量数据。与OpenAI的生成式AI模型结合,可
- 2025-01-11使用Ollama和OpenAI实现多查询RAG的实践指南
在本文中,我们将深入探讨如何使用Ollama和OpenAI来实现基于多查询检索增强生成(RAG)的应用。多查询检索器通过将用户的输入查询转换为多个不同视角的查询,从而在更广泛的背景下检索相关文档。这种方法可以提升答案生成的准确性和丰富性。技术背景介绍RAG(Retrieval-AugmentedG
- 2025-01-10《你的RAG出错了?快来Get这份改进秘籍》
原始RAG框架在提升检索和生成答案质量方面,还有一些关键问题没解决:找出来的文档真的跟用户问题相关吗?有时候可能找偏了。找到的内容够不够回答用户的问题?会不会信息量不足?会不会有一堆没用的信息混进来,反而把答案搞乱了?检索速度够快吗?会不会让用户等太久?万一检索
- 2025-01-10理想汽车大模型算法工程师面试,被摁在地上摩擦。。。
最近面试了理想汽车大模型岗位,被面试官强度拉满了…不仅问到了很多大模型的基础,从通用大模型到大模型微调,再到自动驾驶多模态大模型全方面被拷打,尤其是对大模型如何落地自动驾驶进行了很长时间的讨论。毕竟理想的VLM是国内首个上车的,这块的经验积累还是比较丰富。本文章主
- 2025-01-10RAG项目实战——基于Llamaindex微调BGE Embedding模型(附完整源码和转化好的数据集下载)
在自然语言处理(NLP)领域,检索增强生成(Retrieval-AugmentedGeneration,RAG)模型已经成为一种强大的工具,能够结合检索和生成任务,提供更准确的回答。然而,RAG模型的性能很大程度上依赖于嵌入模型的质量。为了进一步提升RAG模型的检索准确性,我们可以通过对嵌入模型进行微调(Fine-t
- 2025-01-09分块的艺术:提升 RAG 效果的关键
聪明人往往很“懒”,但这种“懒”其实是高效的体现。他们总能找到解决复杂问题的最佳路径,用最少的力气获得最大的成果。在RAG系统中,这种高效的实现往往是通过“分块”来实现的。你可以把它想象成把一本厚书分成几章——这样一来,阅读和理解就轻松多了。同样地,分块技术把大段复杂
- 2025-01-09RAG实战-Markdown文件解析思路分析与实现
TrustRAG项目链接:https://github.com/gomate-community/TrustRAG本文代码链接:https://github.com/gomate-community/TrustRAG/blob/main/trustrag/modules/document/markdown_parser.py最近遇到几个伙伴关于markdown解析的问题,都是比较偏向于实际使用场景的,这里我们一开
- 2025-01-08RAG实战-Markdown文件解析思路分析与实现
TrustRAG项目链接:https://github.com/gomate-community/TrustRAG本文代码链接:https://github.com/gomate-community/TrustRAG/blob/main/trustrag/modules/document/markdown_parser.py最近遇到几个伙伴关于markdown解析的问题,都是比较偏向于实际使用场景的,这里我们一开始我们
- 2025-01-08利用 vLLM 手撸一个多模态RAG系统
利用vLLM实现多模态RAG系统本文将深入探讨如何使用vLLM构建多模态信息检索与生成(MultimodalRAG)系统,以实现对包含文本、图像和表格的文档的有效处理和智能问答。如果您想了解更多关于自然语言处理或其他技术领域的信息,请关注我们的公众号柏企科技圈。一、多模态R
- 2025-01-08关于RAG你不得不了解的17个技巧
英文文章:https://towardsdatascience.com/17-advanced-rag-techniques-to-turn-your-rag-app-prototype-into-a-production-ready-solution-5a048e36cdc8#9085最近在写文章,想补上去年RAG(Retrieval-AugmentedGeneration)遗留的一些坑,希望能分享一些RAG的技巧帮到大家。
- 2025-01-08大模型RAG面试内容有哪些?(附面试资料合集)
在面试涉及大模型RAG(Retrieval-AugmentedGeneration)的职位时,以下是一些常见的面试内容和问题:技术知识RAG的基本概念和工作原理:解释RAG系统的主要部分及其如何协同工作。检索技术:了解常见的检索方法,如向量检索、BM25等,以及如何选择合适的检索器。生成模型:掌握生成模型的基本
- 2025-01-07关于RAG你不得不了解的17个技巧
最近在写文章,想补上去年RAG(Retrieval-AugmentedGeneration)遗留的一些坑,希望能分享一些RAG的技巧帮到大家。还是那句老话:构建一个大模型的原型很容易,但把它变成一个能真正投入生产的产品却很难。这篇文章适合那些在过去一个月里刚刚构建了第一个LLM(大语言模型)应用程序,并开