AI大语言模型LLM学习-Token及流式响应

时间：2024-09-06 22:50:00浏览次数：11

标签：输出 LLM AI token 流式 Token langchain llm

token是什么？

比较官方的token解释：

Token是对输入文本进行分割和编码时的最小单位。它可以是单词、子词、字符或其他形式的文本片段。

token 是自然语言处理的最细粒度。简单点说就是，LLM的输入是一个个的 token，输出也是一个个的 token。
token 是由LLM处理的基本数据单元。在文本的背景下，一个token 可以是一个单词、单词的一部分（子词）或甚至是一个字符，这取决于token 化过程。

LLM的流式输出

单个LLM调用的运行时间通常比传统资源请求运行得更长，当构建需要多个推理步骤的复杂的链式或代理时，这种情况会更加复杂为了解决这个问题，我们可以采用流式输出，输出一旦生成，就可以立即显示。

所谓的流式输出，就是类似打字机式的方式，一个字或一个词的输出，给用户一种答案逐渐出现的动画效果。市面上的LLM模型案例基本上都是以流式输出的方式展示给用户的。
本文只介绍流式输出的概念，之后的文章会分别介绍流式WebAPI的搭建，基于VUE3前端技术构建问答页面。

实践

如果没有看过上一篇文章，可以前去了解下:
AI大语言模型LLM学习-入门篇

依赖安装

pip install langchain

代码

from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
api_key = "api_key(平台注册获得)"

model = "qwen2-72b-instruct"

llm = ChatOpenAI(
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    api_key=api_key,
    model=model,
    streaming=True,
)
prompt_template = ChatPromptTemplate.from_messages([
    ("system", "你是一个很出色的历史老师，给我讲讲历史人物的故事吧。"),
    ("user", "{input}")
])

#使用|操作符将prompt_template和llm连接在一起，创建一个chain对象。
chain =prompt_template | llm

while True:
    question = input("\n请输入你需要了解的历史人物,按q退出:")
    if question == "q":
        break
    else:
        # 使用流式输出
        for token in chain.stream({"input": question}):
            print(token.content, end="")

运行效果：

在langchain中查看StreamingStdOutCallbackHandler的源码，可以找到几个核心的方法：
on_llm_start(self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any)
on_llm_new_token(self, token: str, **kwargs: Any)
on_llm_end(self, response: LLMResult, **kwargs: Any)

在这里插入图片描述
根据on_llm_new_token这个方法名，大家就会明白为啥市面上的问答型AI都是以打字机式的方式进行输出，第一次遇到这种打字机模式，我在心里暗骂那帮前端程序员：会做几个特效就NB了，现在在此向这帮前端程序员表达我深深的歉意。

标签：输出,LLM,AI,token,流式,Token,langchain,llm
From： https://blog.csdn.net/fengqiuhuang123/article/details/141949949

常见的raid有哪些，使用场景是什么
RAID（冗余独立磁盘阵列）是一种将多个物理硬盘组合成一个逻辑单元的技术，以提高数据的可靠性、性能或两者兼而有之。以下是一些常见的RAID级别及其使用场景：1.RAID0特点:数据条带化，没有冗余。所有数据均分散在多个硬盘上。提供最高的读写性能。使用场景:适用于对性能......
带你1分钟玩转AI大模型微调推理，更有限时福利等你领
本文分享自华为云开发者联盟微信公众号《如何1分钟玩转AI大模型微调推理？（文末有福利）》想要低成本用好大模型，必然离不开对它的微调(FineTuning)。那么，为什么大模型需要微调呢？举个例子：一个通用大模型涵盖了许多语言信息，我们和它可以进行流畅的对话。但是如果想要它正确回答“布......
jsp仓储管理系统9e8ai 本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上
jsp仓储管理系统9e8ai本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表项目功能客户,库存人员,入库人员,出库人员,商品类别,商品信息,仓区信息,商品入库,商品出库开题报告内容一、项目背景与意义随着电子商......
RAG与LLM原理及实践(14)---RAG Python 前端构建技术Flask
目录背景Flask简介 Flask的特点flask安装Flaskpythonserver端处理app资源映射router概念Flask客户端处理Jinja2 概述具体语法实例python后端代码前端相关代码代码解释运行check启动日志背景本专栏之前的文章都在描述RAG后台的......
AI产品经理：掌握核心技能：成为AI产品经理的完全指南（附赠福利）
1.AI产品经理是什么回答这个问题前我们首先得理清楚什么是AI产品经理，它和传统的互联网产品经理有什么区别。1.1AI产品经理职责主要职责一方面是规划如何将成熟的AI技术应用在各个领域不同场景中，提升原有场景的效率或效果等；另一方面是基于业务方的需求如何用现有的AI技......
如何成为AI产品经理？AI产品经理成长秘籍：关键技能与职业发展路径全解析
点点说在前面：本篇文章由KingJames来分享关于AI产品经理的必备技能和成长策略。KingJames之前做过AI咨询，对接公司内部AI产品经理，外部对接过很多甲方AI产品经理，也曾手持多家公司AI产品经理的offer。快读完这则诚意满满的大佬干货帖吧！—1—AI产品经理是什么回答这个问......
AI产品经理：零经验转行AI产品经理：从入门到精通的全面指南
本篇文章来自于一个YouTube视频的内容，对于如何成为AI产品是一个很好的入门贴，这篇文章也是通过AI协助编辑过来的。通过这次编辑，也初步尝试了各大Chatbot的能力，总体体验，拥有长上下文能力的kimibot的体验最好，能将4000+字的英文完整翻译并进行初步的排版。但是通过这个......
LLM大模型：从新手到专家：AI大模型学习与实践完全指南
一、初聊大模型1、什么是大模型？大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，这些参数就像是大脑中的神经元，它们通过......
使用centos7搭建RAID磁盘阵列，RAID0,RAID1,RAID5,ARID10，讲述RAID0、1、5、10的原理。
1.RAID概念磁盘阵列（RedundantArraysofIndependentDisks，RAID），有“独立磁盘构成的具有冗余能力的阵列”之意。磁盘阵列是由很多价格较便宜的磁盘，以硬件（RAID卡）或软件（MDADM）形式组合成一个容量巨大的磁盘组，利用多个磁盘组合在一起，提升整个磁盘系统效能。利用这项技术，将数据切割......
【待做】【Linux系列】使用fail2ban配置动态防火墙
一、安装二、测试三、基本配置四、相关命令原创戒一双LINUX开源玩家前面说的防火墙基本是静态的情况，在实际运行中我们可能需要动态调整防火墙策略，此时可以考虑使用Fail2ban。Fail2ban可以通过创建规则，自动更改防火墙配置，在尝试登录失败达到一定次数后禁止特定IP，......

AI大语言模型LLM学习-Token及流式响应

token是什么？

LLM的流式输出

实践

相关文章

赞助商

阅读排行