如何在 Python 中使用 Langchain 返回已使用的上下文以进行回答

时间：2024-08-07 04:18:18浏览次数：17

标签：python langchain large-language-model

我已经构建了一个像这样的 RAG 系统：

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

response_schemas = [
    ResponseSchema(name="price", description="Price", type="float"),
    ResponseSchema(name="unit", description="Unit", type="int"),
]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

rag_prompt = PromptTemplate(
    input_variables=["context","question"],
    template=template,
    partial_variables={"format_instructions": output_parser.get_format_instructions()},
)

rag_chain = (
    {"context": compression_retriever | format_docs, "question": RunnablePassthrough()}
    | rag_prompt
    | llm
    | output_parser
)

query = "What is the price? How many units?"

response = rag_chain.invoke(query, config={"configurable": {"session_id": "abc123"}},)

但是我的响应是一个 JSON，其中我的价格和单位仅作为键。我希望能够有一个“上下文”变量来存储算法用来回答问题的文档中使用的段落。

知道我该怎么做吗？

要返回用于回答 Langchain 中的查询的上下文，需要修改的代码以包含源文档。以下是如何执行此操作的方法：

启用源信息跟踪： 在 Langchain 中，可以使用 include_source_documents 参数将源文档包含在响应中。
修改的 rag_chain 定义：

python rag_chain = ( {"context": compression_retriever | format_docs, "question": RunnablePassthrough()} | rag_prompt | llm.bind(include_source_documents=True) | output_parser ) 我们在这里对 llm 使用 .bind() ，以在调用时传递 include_source_documents=True 。

从响应中访问上下文： 现在，的响应将包含一个 source_documents 字段，其中包含用于生成答案的文档。

```python response = rag_chain.invoke(query, config={"configurable": {"session_id": "abc123"}})

print(response.json()) # 打印结构化输出 print(response.source_documents) # 打印源文档列表 ```

完整的更新代码：

from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.llms import OpenAI
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain.prompts import PromptTemplate
from langchain.schema import (
    HumanMessage,
    SystemMessage,
    AIMessage,
)
from langchain.output_parsers import StructuredOutputParser, ResponseSchema

# ... [的文档加载和检索器设置] ...

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

response_schemas = [
    ResponseSchema(name="price", description="Price", type="float"),
    ResponseSchema(name="unit", description="Unit", type="int"),
]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

rag_prompt = PromptTemplate(
    input_variables=["context", "question"],
    template=template,  # 在这里定义的模板
    partial_variables={"format_instructions": output_parser.get_format_instructions()},
)

rag_chain = (
    {"context": compression_retriever | format_docs, "question": RunnablePassthrough()}
    | rag_prompt
    | llm.bind(include_source_documents=True)  # 启用源文档包含
    | output_parser
)

query = "What is the price? How many units?"

response = rag_chain.invoke(query, config={"configurable": {"session_id": "abc123"}})

print(response.json()) 
print(response.source_documents)

现在，可以访问 response.source_documents 以获取用于回答查询的上下文。

标签：python,langchain,large-language-model
From： 78840242

如何从 python socket.sendmsg 获取套接字 Tx 时间戳
在阅读此处、此处和此处时，我发现在Linux系统上，您可以通过设置套接字选项来请求接收和传输的数据包的时间戳。我目前可以使用SO_TIMESTAMPNS和SO_TIMESTAMPING来通过recvmsg获取Rx时间戳。使用sendmsg我不知道......
Python 类型注释中“|”两边是否“强制”使用空格？
“Union运算符”|没有出现在PEP8的其他建议中的“始终被空格包围的运算符”列表中因此，应该可以将其样式设置为类似于算术运算符，并删除圆括号、方括号内的空格，或者如果该运算符比表达式中的其他运算符具有更高的优先级。在我看来，删除空格可以提高表达式......
ArcPro (3.2+) Python 脚本工具中从 .atbx Toolbox 相对导入本地模块
我设置了一个库和关联的ArcGISToolbox，以便：/root├──Toolbox.atbx├──mylib│└──my_function.py├──my_tools│└──my_gp_script.py我将代码存储库的开发克隆保存在公司共享服务器上的一个位置，并在GitHub上托管一份副本。当我进行更新时，我会......
Python vs. R：揭秘机器学习领域的双璧
一、引言1.1背景介绍随着大数据和人工智能技术的飞速发展，机器学习已经成为了一个热门领域。在机器学习领域，Python和R是两种广泛使用的编程语言。Python因其简洁易读的语法和强大的库支持，成为了最受欢迎的编程语言之一。而R则以其强大的统计分析和数据可视化能力，在统计学......
Windows10 安装编译后的 pysqlcipher3-1.2.1 基于 Python 3.8.10
Windows10安装编译后的pysqlcipher3-1.2.1基于Python3.8.10本文主要是将直接安装编译后的文件，不一定的成功，但是可以尝试使用，若无法直接安装，请参考编译过程，自行编译安装，编译过程见这里安装pysqlcipher3这里用32位举例因为64位安装完全相同，只需要把对应的位数换成64......
【Python】Python基础语法知识点汇集
Python是一种高级的、解释型的编程语言，以其清晰的语法和代码可读性而闻名。本篇文章将汇集Python编程的基础语法知识点，为初学者提供一个全面的学习指南。......
启动Python 的内置服务器访问本地图片
要使用Python的内置服务器访问本地图片并正确地显示在浏览器中，你需要将图片文件放在内置服务器的根目录或其子目录中。以下是详细步骤：1.将图片文件复制到服务器根目录：例如，将zheng.jpeg文件复制到一个特定的目录中（例如，你的项目目录）。假设你将图片文件复制到C:\Users\panda......
17：Python数据类型练习题
#1获取c1，c2相同的元素列表c1=[11,22,33]c2=[22,33,44]foriinc1:ifiinc2:print(i)#2获取c1中有，c2没有的元素列表foriinc1:ifinotinc2:print(i)#3获取c2中有，c1没有的元素列表foriinc2:ifinotinc1:print(i)#4获......
(Jmeter新玩法)Python 调 Jmeter执行参数化jmx脚本
#Python调Jmeter执行参数化jmx脚本importosfromos.pathimportjoinimporttimeimportrefromstringimportTemplatejmeter_Home=r"F:\softtotal\xxx\bin\jmeter.bat"#jmx文件路径currpath=os.path.dirname(os.path.realpath(__file__))#要运行的jmx脚......
LangChain与JWT：构建安全认证的桥梁
LangChain与JWT：构建安全认证的桥梁在现代Web应用和微服务架构中，安全认证是保护数据和资源访问的关键。JSONWebTokens（JWT）作为一种广泛使用的开放标准，为安全传输提供了一种简洁而自包含的方式。LangChain，作为一个假设的编程辅助工具，如果存在，它可能会支持JWT，以增强其在安全......

如何在 Python 中使用 Langchain 返回已使用的上下文以进行回答

相关文章

赞助商

阅读排行