首页 > 其他分享 >大模型的短期记忆和上期记忆各自的使用场景

大模型的短期记忆和上期记忆各自的使用场景

时间:2024-07-18 15:25:54浏览次数:16  
标签:场景 模型 用户 上期 对话 记忆 短期 记住

吾名爱妃,性好静亦好动。好编程,常沉浸于代码之世界,思维纵横,力求逻辑之严密,算法之精妙。亦爱篮球,驰骋球场,尽享挥洒汗水之乐。且喜跑步,尤钟马拉松,长途奔袭,考验耐力与毅力,每有所进,心甚喜之。

 
吾以为,编程似布阵,算法如谋略,需精心筹谋,方可成就佳作。篮球乃团队之艺,协作共进,方显力量。跑步与马拉松,乃磨炼身心之途,愈挫愈勇,方能达至远方。愿交志同道合之友,共探此诸般妙趣。

诸君,此文尚佳,望点赞收藏,谢之!

大模型的记忆能力是不可或缺的一部分。目前,有多种方法可以让AI应用具备记忆功能,其中一种是仿照人脑记忆原理,给大模型添加显式记忆。人类的记忆大致可以分为三部分:显式记忆、隐式记忆、外部信息。其中显式记忆可以主动回忆的长期记忆,比如读过的文章,获取显式记忆很容易,但提取时需要一定的回忆过程。隐式记忆是无意识使用的长期记忆,比如骑自行车的技能,获取隐式记忆需要大量重复练习,但使用时毫不费力。可以看出,两种记忆形式在获取和使用的效率上形成了鲜明的互补。

对于大模型而言,其“长期记忆”存储在模型的参数中,短期记忆则体现为模型一次对话中可回忆起的上下文长度的context。例如GPT-4的context是128k,这相当于可一次性输入10万汉字左右。大模型的短期记忆和长期记忆的使用场景如下:

  • 短期记忆
    • 多轮对话场景:在多轮对话中,模型需要记住之前的对话内容,以便更好地理解当前的问题和回答。短期记忆可以帮助模型在短期内记住相关信息,从而提高对话的连贯性和准确性。
    • 实时交互场景:例如聊天机器人、智能客服等,需要根据用户的实时输入提供回答。短期记忆可以帮助模型快速记住用户的当前问题和历史对话记录,从而更好地理解用户需求并提供准确的回答。
    • 信息检索和推荐:根据用户的短期兴趣和行为,提供个性化的信息检索和推荐服务。
  • 长期记忆
    • 知识问答系统:可以利用长期记忆存储大量的知识和信息,例如历史事件、科学原理、文化常识等,从而能够回答各种问题,并提供相关的解释和说明。
    • 个性化服务:通过长期记忆了解用户的偏好、习惯和需求,从而提供个性化的服务和推荐。例如,根据用户的历史购买记录推荐相关的产品或服务。
    • 数据分析和预测:分析和挖掘大量的数据,从中发现模式和趋势,并进行预测和决策。例如,预测市场趋势、股票价格等。

 短期记忆能够显著提高大模型在对话中的连贯性,主要体现在以下几个方面:

1. 维持对话主题
在对话过程中,话题可能会有所转换和深入。短期记忆使大模型能够记住当前正在讨论的主题,避免突然偏离或跳跃到不相关的内容。例如,当讨论旅游计划时,短期记忆能帮助模型记住之前提到的目的地、出行时间等关键信息,从而围绕这些要点给出连贯的回应,如“我们之前说要在 8 月去三亚,那接下来可以考虑预订机票和酒店。”

2. 参考前文语境
用户的表述可能存在一些模糊或不完整的地方,但通过短期记忆回顾之前的对话内容,模型可以更好地理解用户的意图。比如,用户说“那个不错”,模型可以依据短期记忆中的前文提到的多个事物,推断出用户所指的具体对象,进而做出准确的回应,“您说的那个不错,是指刚才提到的蓝色连衣裙吗?”

3. 保持逻辑一致性
对话应该遵循一定的逻辑顺序和因果关系。短期记忆让大模型能够记住之前的推理和论证过程,从而保证回答的逻辑连贯性。假设在讨论解决一个技术问题的步骤,模型能够凭借短期记忆记住之前提出的方法和遇到的障碍,进而给出合理的下一步建议,“我们之前尝试了方法 A 但没有成功,接下来可以试试方法 B。”

4. 回应细节准确
对于一些需要精确信息的对话,短期记忆能够确保模型准确回应。比如在讨论一场会议的安排时,模型能记住具体的时间、地点、参与人员等细节,从而给出完整且准确的回答,“会议定在明天下午两点,在公司的 301 会议室,参会人员有部门经理和各位同事。”

短期记忆通过维持主题、参考语境、保持逻辑和确保细节准确等方式,大大增强了大模型在对话中的连贯性,为用户提供更自然、流畅和有意义的交流体验

标签:场景,模型,用户,上期,对话,记忆,短期,记住
From: https://blog.csdn.net/andy_april/article/details/140523274

相关文章

  • 供应链场景使用ClickHouse最佳实践
    关于ClickHouse的基础概念这里就不做太多的赘述了,ClickHouse官网都有很详细说明。结合供应链数字化团队在使用ClickHouse时总结出的一些注意事项,尤其在命名方面要求研发严格遵守约定,对日常运维有很大的帮助,也希望对读者有启发。目前供应链数字化ck集群用来存储实时数据,先通过下面......
  • 【AI应用探讨】—生成对抗网络(GAN)应用场景
    目录1.图像生成2.数据增强3.图像编辑与风格转换4.视频生成5.游戏设计6.其他领域1.图像生成应用场景:艺术创作:艺术家和设计师使用GAN生成的图像作为创作的灵感,创造出新颖、独特的艺术品。GAN可以生成具有特定风格的画作,如油画、水彩画等,为艺术创作提供新的可能......
  • flexbox布局使用场景
    flexbox又称弹性布局,目标是提供一个更有效的布局,对齐方式主要思想:父元素能够调整子元素的宽度,高度,排列方式,从而更好的适用布局空间1、水平垂直居中对齐justify-content主轴对齐方式flex-start(默认值):左对齐flex-end:右对齐center:居中space-between:两端对齐,项目之间的间隔......
  • 性能测试场景设计
    简介性能测试场景设计是指定义和创建用于评估系统性能的模拟场景的过程。这些场景通常包括模拟用户行为、负载模式和使用情况,以便在实际环境下测量系统的性能表现。性能测试场景设计的目标是模拟真实世界中的使用情况,以便评估系统在不同条件下的性能、稳定性和可靠性。性能测试......
  • 基于java+ssm+vue记忆旅游-酒店特产商城美食-景点vue(源码+数据库+lw+PPT+讲解视频)
    前言......
  • 【python学习】第三方库之tensorflow的定义、功能、使用场景、代码示例和解释
    引言tensorFlow是一个开源的软件库,最初由GoogleBrain团队的研究员和工程师开发,用于数值计算和大规模机器学习tensorFlow提供了丰富的API来支持各种计算任务,并且能够轻松地在多种计算设备上进行部署,包括CPU、GPU和TPU文章目录引言一、安装`tensorflow`第三方......
  • Java身份证识别接口在打车场景的应用
    曾几何时,滴滴打车似乎成了打车一族的首选,评论有好有坏。近几日,美团打车在上海的首秀还不错。为了吸引更多司机加入,美团还设置了新人推荐奖。根据美团打车司机端的信息显示,3月20和3月31日期间,司机每邀请一名新司机,并且新司机完成8单,即可拿到100元奖励。根据美团的宣传,其首日接......
  • 想编辑GIS场景该怎么办?快来试试这款免费可视化工具
    想编辑GIS场景该怎么办?别急,山海鲸可视化这款免费可视化工具能帮你轻松搞定。作为一款免费可视化工具,山海鲸可视化不仅功能强大,而且使用便捷,简直是GIS从业者的福音。 首先,山海鲸可视化的GIS场景编辑功能极为强大。它支持多种常见的GIS文件格式,并且内置了丰富的编辑工具,让你可以......
  • LangChain让LLM带上记忆
    最近两年,我们见识了“百模大战”,领略到了大型语言模型(LLM)的风采,但它们也存在一个显著的缺陷:没有记忆。在对话中,无法记住上下文的LLM常常会让用户感到困扰。本文探讨如何利用LangChain,快速为LLM添加记忆能力,提升对话体验。LangChain是LLM应用开发领域的最大社区和......
  • iOS开发基础110-Core Graphics应用场景
    CoreGraphics是一种强大的二维图形绘制框架,广泛应用于iOS开发中。以下是几个常见的运用场景以及对应的代码示例:1.自定义视图绘制通过覆盖UIView的drawRect:方法,可以自定义视图的外观。示例代码:#import<UIKit/UIKit.h>@interfaceCustomView:UIView@end@implementat......