大模型的短期记忆和上期记忆各自的使用场景

标签：场景模型用户上期对话记忆短期记住

吾名爱妃，性好静亦好动。好编程，常沉浸于代码之世界，思维纵横，力求逻辑之严密，算法之精妙。亦爱篮球，驰骋球场，尽享挥洒汗水之乐。且喜跑步，尤钟马拉松，长途奔袭，考验耐力与毅力，每有所进，心甚喜之。

吾以为，编程似布阵，算法如谋略，需精心筹谋，方可成就佳作。篮球乃团队之艺，协作共进，方显力量。跑步与马拉松，乃磨炼身心之途，愈挫愈勇，方能达至远方。愿交志同道合之友，共探此诸般妙趣。

诸君，此文尚佳，望点赞收藏，谢之！

大模型的记忆能力是不可或缺的一部分。目前，有多种方法可以让AI应用具备记忆功能，其中一种是仿照人脑记忆原理，给大模型添加显式记忆。人类的记忆大致可以分为三部分：显式记忆、隐式记忆、外部信息。其中显式记忆可以主动回忆的长期记忆，比如读过的文章，获取显式记忆很容易，但提取时需要一定的回忆过程。隐式记忆是无意识使用的长期记忆，比如骑自行车的技能，获取隐式记忆需要大量重复练习，但使用时毫不费力。可以看出，两种记忆形式在获取和使用的效率上形成了鲜明的互补。

对于大模型而言，其“长期记忆”存储在模型的参数中，短期记忆则体现为模型一次对话中可回忆起的上下文长度的context。例如GPT-4的context是128k，这相当于可一次性输入10万汉字左右。大模型的短期记忆和长期记忆的使用场景如下：

短期记忆：
- 多轮对话场景：在多轮对话中，模型需要记住之前的对话内容，以便更好地理解当前的问题和回答。短期记忆可以帮助模型在短期内记住相关信息，从而提高对话的连贯性和准确性。
- 实时交互场景：例如聊天机器人、智能客服等，需要根据用户的实时输入提供回答。短期记忆可以帮助模型快速记住用户的当前问题和历史对话记录，从而更好地理解用户需求并提供准确的回答。
- 信息检索和推荐：根据用户的短期兴趣和行为，提供个性化的信息检索和推荐服务。
长期记忆：
- 知识问答系统：可以利用长期记忆存储大量的知识和信息，例如历史事件、科学原理、文化常识等，从而能够回答各种问题，并提供相关的解释和说明。
- 个性化服务：通过长期记忆了解用户的偏好、习惯和需求，从而提供个性化的服务和推荐。例如，根据用户的历史购买记录推荐相关的产品或服务。
- 数据分析和预测：分析和挖掘大量的数据，从中发现模式和趋势，并进行预测和决策。例如，预测市场趋势、股票价格等。

短期记忆能够显著提高大模型在对话中的连贯性，主要体现在以下几个方面：

1. 维持对话主题：
在对话过程中，话题可能会有所转换和深入。短期记忆使大模型能够记住当前正在讨论的主题，避免突然偏离或跳跃到不相关的内容。例如，当讨论旅游计划时，短期记忆能帮助模型记住之前提到的目的地、出行时间等关键信息，从而围绕这些要点给出连贯的回应，如“我们之前说要在 8 月去三亚，那接下来可以考虑预订机票和酒店。”

2. 参考前文语境：
用户的表述可能存在一些模糊或不完整的地方，但通过短期记忆回顾之前的对话内容，模型可以更好地理解用户的意图。比如，用户说“那个不错”，模型可以依据短期记忆中的前文提到的多个事物，推断出用户所指的具体对象，进而做出准确的回应，“您说的那个不错，是指刚才提到的蓝色连衣裙吗？”

3. 保持逻辑一致性：
对话应该遵循一定的逻辑顺序和因果关系。短期记忆让大模型能够记住之前的推理和论证过程，从而保证回答的逻辑连贯性。假设在讨论解决一个技术问题的步骤，模型能够凭借短期记忆记住之前提出的方法和遇到的障碍，进而给出合理的下一步建议，“我们之前尝试了方法 A 但没有成功，接下来可以试试方法 B。”

4. 回应细节准确：
对于一些需要精确信息的对话，短期记忆能够确保模型准确回应。比如在讨论一场会议的安排时，模型能记住具体的时间、地点、参与人员等细节，从而给出完整且准确的回答，“会议定在明天下午两点，在公司的 301 会议室，参会人员有部门经理和各位同事。”

短期记忆通过维持主题、参考语境、保持逻辑和确保细节准确等方式，大大增强了大模型在对话中的连贯性，为用户提供更自然、流畅和有意义的交流体验

标签：场景,模型,用户,上期,对话,记忆,短期,记住
From： https://blog.csdn.net/andy_april/article/details/140523274

大模型的短期记忆和上期记忆各自的使用场景

相关文章

赞助商

阅读排行