rag

2025-01-17超越 RAG：Memobase 为 AI 应用注入长期记忆丨社区来稿
本文由RTE开发者社区成员通过社区网站投稿提供，如果你也有与实时互动（Real-TimeEngagement，RTE）相关的项目分享，欢迎访问网站rtecommunity.dev发布，优秀项目将会在公众号发布分享。目录什么是AI记忆？ AI记忆的类型短记忆vs.长记忆UserMemoryvs.AgentMemory：两种
2025-01-16一文读懂：大模型RAG（检索增强生成）含高级方法
RAGRAG检索增强生成（RetrievalAugmentedGeneration），已经成为当前最火热的LLM应用方案。理解不难，就是通过自有垂域数据库检索相关信息，然后合并成为提示模板，给大模型生成漂亮的回答。业界不知道大模型的基本没有，大家对大模型的能力也有一定的了解，但是当我们将大模型应用于实际
2025-01-15【RAG框架】蚂蚁开源新RAG框架KAG，可达91%准确率
本文探一探蚂蚁开源的另外一套知识增强生成框架KAG（KnowledgeAugmentedGeneration），专门用于构建垂直领域知识库的逻辑推理问答框架，论文中提到在电子政务达到了91.6的准确率，电子医疗各个问答也有不俗的准确率。本文会简单的介绍一下KAG的概念和构建流程，然后尝试在本地启动KA
2025-01-15AI应用开发先了解这些概念：智能体、LLM、RAG、提示词工程
什么是智能体(Agent)一种基于LLM（LargeLanguageModel）的能够感知环境、做出决策并执行行动以实现特定目标的自主系统。与传统人工智能不同，AlAgent模仿人类行为模式解决问题，通过独立思考和调用工具逐步完成给定目标，实现自主操作。通用智能体平台以Agent为核心技术驱动，
2025-01-15Agentic RAG 系统的崛起
探秘智能检索新境界：AgenticRAG系统的崛起
2025-01-15构建本地知识库：基于 LangChain 和 Ollama 的 RAG 实现教程
构建本地知识库：基于LangChain和Ollama的RAG实现教程简介在这个教程中，我们将学习如何构建一个本地运行的知识库系统，它能够让用户上传PDF或TXT文档，并通过自然语言与文档内容进行交互。这个系统使用了RAG（检索增强生成）技术，结合了LangChain、Ollama和Streamlit
2025-01-14AI大模型学习路径：适合每个人的详细步骤与技巧！
23年AI大模型技术狂飙一年后，24年AI大模型的应用已经在爆发，因此掌握好AI大模型的应用开发技术就变成如此重要，那么如何才能更好地掌握呢？一份AI大模型详细的学习路线就变得非常重要！由于AI大模型应用技术比较新，业界也没什么参照标准，打造AI大模型技术的学习路线并非
2025-01-14【向量数据库】搭建RAG架构，如何选择向量数据库产品？
搭建RAG架构应用时，选择合适的向量数据库是关键。向量数据库是RAG系统的核心组件，负责存储和检索高维向量数据，从而支持高效的语义搜索和信息检索功能。那么今天与大家分享下如何选择向量数据库，以及主流向量数据库产品的推荐，供您参考学习。如何选择向量数据库？性能与延迟：向量数据库
2025-01-13借助 LangGraph、OpenAI 和 Tavily 构建自适应 RAG 系统（含代码）
自适应RAG系统（Multi-AgenticRAG：探索智能问答系统的新边界（含代码））是一种能够根据用户查询的具体语境，动态选择检索策略与生成方式的人工智能系统。它结合了先进的自然语言处理技术和信息检索算法，能够在海量数据中快速定位相关信息，并基于这些信息生成准确、连贯的回答。LangGraph
2025-01-13TrustRAG：增强RAG系统鲁棒性与可信度的创新框架
在人工智能飞速发展的今天，大语言模型（LLMs）凭借其强大的语言处理能力在诸多领域大放异彩。检索增强生成（RAG）系统（面向企业RAG（RetrievalAugmentedGeneration）系统的多维检索框架）的出现，通过整合外部知识源进一步提升了LLMs的性能，使其能针对用户查询提供更准确、更具上下文相关性的
2025-01-12RAG中的文本切分策略详解
RAG中的文本切分策略详解1.选择RAG中的文本切分策略1.1不同的文本切分策略1.CharacterTextSplitter-这是最简单的方法。它默认基于字符（默认为""）来切割，并且通过字符的数量来衡量块的长度2.RecursiveCharacterTextSplitter-基于字符列表拆分文本。3.-基
2025-01-12【Docker】Docker搭建一款开源的RAG聊天应用
项目介绍Kotaemon是一个由Cinnamon开发的开源项目，旨在提供一个基于检索增强生成（RAG）技术的用户界面，使用户能够与自己的文档进行交互问答。功能特点文档问答：Kotaemon允许用户通过自然语言查询与文档进行交互，快速获取所需信息。这一功能在学术研究、企业文档管理等领域具有广泛应
2025-01-11使用 MongoDB 和 OpenAI 实现 RAG 的实战指南
在本篇文章中，我们将深入探讨如何使用MongoDB和OpenAI实现检索增强生成（RAG，Retrieve-AugmentedGeneration）。通过结合数据库的高效检索能力和语言模型的生成能力，可以创建出功能强大的应用。接下来，我们将详细介绍如何搭建这样的系统，并提供可运行的代码示例。技术背景介绍
2025-01-11使用RAG与LanceDB和OpenAI构建智能应用
在现代AI应用中，结合现有知识库与生成式AI模型进行信息检索与生成（RAG）正变得愈加重要。本文将指南特如何通过LanceDB和OpenAI实现RAG，帮助开发者快速搭建智能应用。技术背景介绍LanceDB是一个高效、面向AI的数据库，能够存储和检索大量向量数据。与OpenAI的生成式AI模型结合，可
2025-01-11使用Ollama和OpenAI实现多查询RAG的实践指南
在本文中，我们将深入探讨如何使用Ollama和OpenAI来实现基于多查询检索增强生成（RAG）的应用。多查询检索器通过将用户的输入查询转换为多个不同视角的查询，从而在更广泛的背景下检索相关文档。这种方法可以提升答案生成的准确性和丰富性。技术背景介绍RAG（Retrieval-AugmentedG
2025-01-10《你的RAG出错了？快来Get这份改进秘籍》
原始RAG框架在提升检索和生成答案质量方面，还有一些关键问题没解决：找出来的文档真的跟用户问题相关吗？有时候可能找偏了。找到的内容够不够回答用户的问题？会不会信息量不足？会不会有一堆没用的信息混进来，反而把答案搞乱了？检索速度够快吗？会不会让用户等太久？万一检索
2025-01-10理想汽车大模型算法工程师面试，被摁在地上摩擦。。。
最近面试了理想汽车大模型岗位，被面试官强度拉满了…不仅问到了很多大模型的基础，从通用大模型到大模型微调，再到自动驾驶多模态大模型全方面被拷打，尤其是对大模型如何落地自动驾驶进行了很长时间的讨论。毕竟理想的VLM是国内首个上车的，这块的经验积累还是比较丰富。本文章主
2025-01-10RAG项目实战——基于Llamaindex微调BGE Embedding模型（附完整源码和转化好的数据集下载）
在自然语言处理（NLP）领域，检索增强生成（Retrieval-AugmentedGeneration,RAG）模型已经成为一种强大的工具，能够结合检索和生成任务，提供更准确的回答。然而，RAG模型的性能很大程度上依赖于嵌入模型的质量。为了进一步提升RAG模型的检索准确性，我们可以通过对嵌入模型进行微调（Fine-t
2025-01-09分块的艺术：提升 RAG 效果的关键
聪明人往往很“懒”，但这种“懒”其实是高效的体现。他们总能找到解决复杂问题的最佳路径，用最少的力气获得最大的成果。在RAG系统中，这种高效的实现往往是通过“分块”来实现的。你可以把它想象成把一本厚书分成几章——这样一来，阅读和理解就轻松多了。同样地，分块技术把大段复杂
2025-01-09RAG实战-Markdown文件解析思路分析与实现
TrustRAG项目链接：https://github.com/gomate-community/TrustRAG本文代码链接：https://github.com/gomate-community/TrustRAG/blob/main/trustrag/modules/document/markdown_parser.py最近遇到几个伙伴关于markdown解析的问题，都是比较偏向于实际使用场景的，这里我们一开
2025-01-08RAG实战-Markdown文件解析思路分析与实现
TrustRAG项目链接：https://github.com/gomate-community/TrustRAG本文代码链接：https://github.com/gomate-community/TrustRAG/blob/main/trustrag/modules/document/markdown_parser.py最近遇到几个伙伴关于markdown解析的问题，都是比较偏向于实际使用场景的，这里我们一开始我们
2025-01-08利用 vLLM 手撸一个多模态RAG系统
利用vLLM实现多模态RAG系统本文将深入探讨如何使用vLLM构建多模态信息检索与生成（MultimodalRAG）系统，以实现对包含文本、图像和表格的文档的有效处理和智能问答。如果您想了解更多关于自然语言处理或其他技术领域的信息，请关注我们的公众号柏企科技圈。一、多模态R
2025-01-08关于RAG你不得不了解的17个技巧
英文文章：https://towardsdatascience.com/17-advanced-rag-techniques-to-turn-your-rag-app-prototype-into-a-production-ready-solution-5a048e36cdc8#9085最近在写文章，想补上去年RAG（Retrieval-AugmentedGeneration）遗留的一些坑，希望能分享一些RAG的技巧帮到大家。
2025-01-08大模型RAG面试内容有哪些？（附面试资料合集）
在面试涉及大模型RAG（Retrieval-AugmentedGeneration）的职位时，以下是一些常见的面试内容和问题：技术知识RAG的基本概念和工作原理：解释RAG系统的主要部分及其如何协同工作。检索技术：了解常见的检索方法，如向量检索、BM25等，以及如何选择合适的检索器。生成模型：掌握生成模型的基本
2025-01-07关于RAG你不得不了解的17个技巧
最近在写文章，想补上去年RAG（Retrieval-AugmentedGeneration）遗留的一些坑，希望能分享一些RAG的技巧帮到大家。还是那句老话：构建一个大模型的原型很容易，但把它变成一个能真正投入生产的产品却很难。这篇文章适合那些在过去一个月里刚刚构建了第一个LLM（大语言模型）应用程序，并开