首页 > 其他分享 >AI大模型-提示工程学习笔记9-生成知识提示

AI大模型-提示工程学习笔记9-生成知识提示

时间:2025-01-20 15:58:03浏览次数:3  
标签:提示 背景 模型 知识 笔记 生成 AI 推理

卷首语:我所知的是我自己非常无知,所以我要不断学习。

写给AI入行比较晚的小白们(比如我自己)看的,大神可以直接路过无视了。

有一种改进大语言模型(LLM)推理能力的技术:生成知识作为提示的一部分。这种方法由 Liu 等人(2022)提出,旨在通过让模型先生成相关知识,再将这些知识整合到推理过程中,从而提高模型在常识推理和复杂任务中的表现。

1. 背景与问题

(1) LLM 的局限性

  • 大语言模型在处理需要常识或世界知识的任务时,可能会生成错误的答案。
  • 例如,模型可能会因为缺乏对问题背景的理解而做出错误的预测:
    • 这个回答是错误的,因为高尔夫球的目标是以最低的分数完成比赛,而不是“更高的得分”。

(2) 传统方法的不足

  • 传统的提示工程方法(如链式思维提示,CoT)虽然可以引导模型逐步推理,但仍然依赖于模型本身的知识库。
  • 如果模型的内置知识不足,或者提示没有提供足够的背景信息,模型可能会生成错误的答案。

2. 核心思想

(1) 方法概述

  • 在模型做出预测之前,先让模型生成与问题相关的知识。
  • 将生成的知识作为提示的一部分,帮助模型更好地理解问题并得出正确答案。

(2) 工作流程

  1. 生成知识
    • 给模型一个输入(如问题或陈述),让它生成与之相关的背景知识。
    • 例如:
  2. 整合知识
    • 将生成的知识与问题结合,重新格式化为问答(QA)格式。
    • 例如:
  3. 推理与回答
    • 基于生成的知识,模型进行推理并得出答案。
    • 例如:

3. 方法的优势

(1) 提高推理准确性

  • 通过生成知识,模型可以弥补自身知识库的不足,避免因缺乏背景信息而生成错误答案。
  • 例如,在高尔夫球的问题中,生成的知识明确指出了比赛的目标是“最低分”,从而帮助模型得出正确答案。

(2) 适用于常识推理任务

  • 这种方法特别适合需要常识或世界知识的任务,例如:
    • 判断陈述的正确性。
    • 回答涉及背景知识的问题。
    • 解决需要多步推理的复杂任务。

(3) 增强模型的解释能力

  • 生成知识的过程可以作为模型推理的“解释”部分,帮助用户理解模型是如何得出答案的。
  • 例如:

(4) 减少提示设计的复杂性

  • 传统的提示工程需要设计复杂的提示来引导模型生成正确答案,而生成知识的方法可以通过简单的提示生成相关背景信息,从而简化提示设计。

4. 方法的局限性

尽管生成知识的方法有显著的优势,但它也存在一些局限性:

(1) 知识生成的质量

  • 如果模型生成的知识本身不准确或不相关,可能会导致错误的推理。
  • 例如:
    • 在这种情况下,错误的知识直接导致了错误的答案。

(2) 计算成本

  • 生成知识的过程需要额外的计算资源,尤其是在处理复杂问题时,可能需要生成多条知识。
  • 这会增加推理的时间和成本。

(3) 不适用于所有任务

  • 生成知识的方法主要适用于需要背景信息的任务,对于简单的生成任务(如翻译、摘要)可能没有明显优势。

(4) 知识的整合与选择

  • 当生成多条知识时,如何选择最相关的知识并整合到推理过程中是一个挑战。
  • 如果知识之间存在矛盾,可能会影响模型的推理能力。

5. 应用场景

生成知识作为提示的方法可以应用于以下场景:

(1) 常识推理

  • 解决涉及常识判断的问题,例如:

(2) 科学与技术问答

  • 回答涉及科学或技术背景的问题,例如:

(3) 复杂推理任务

  • 解决需要多步推理的任务,例如数学问题、逻辑推理等。

(4) 教育与学习

  • 为学生提供详细的背景知识和解释,帮助他们更好地理解问题。

6. 展望

生成知识作为提示的一部分,是一种改进大语言模型推理能力的有效方法。它通过让模型生成相关背景知识,弥补了模型知识库的不足,从而提高了推理的准确性和解释能力。

未来发展方向

  • 知识生成的优化:改进知识生成的质量和相关性,减少错误知识的影响。
  • 自动知识选择:开发算法自动选择最相关的知识,避免知识冲突。
  • 多模态知识生成:结合文本、图像、音频等多模态信息,生成更全面的知识。
  • 与外部知识库结合:将生成知识与外部知识库(如维基百科)结合,进一步提升模型的推理能力。

标签:提示,背景,模型,知识,笔记,生成,AI,推理
From: https://blog.csdn.net/972301/article/details/145263488

相关文章

  • 为AI聊天工具添加一个知识系统 之57前端工具:知识图谱、语义网络和认知地图 之2
    本文要点两种推理:演绎deduction和推论inference这两种推理方式(正推-实践常识和反证-常识批判)分别适用于在语义网络、认知地图工具分别用于肯定-求同(演绎推理-”有限解“必然的推理两种:推论corollaries (可能的)和定论theorems(必然的))和否定-求异(推论推理--”无限解“的可......
  • Python Playwright学习笔记(二)
    一、模拟手机playwright.devices可以配置模拟器。importasynciofromplaywright.async_apiimportasync_playwrightasyncdefrun(playwright):iphone_12=playwright.devices['iPhone12']browser=awaitplaywright.webkit.launch(headless=False)conte......
  • 几乎是跪着看完AI教母李飞飞的开年巨作!-《AI Agent:多模态交互前沿调查》
    多模态AI系统很可能会在我们的日常生活中无处不在。将这些系统具身化为物理和虚拟环境中的代理是一种有前途的方式,以使其更加互动化。目前,这些系统利用现有的基础模型作为构建具身代理的基本构件。将代理嵌入这样的环境中,有助于模型处理和解释视觉和上下文数据的能力,这是创......
  • 【迁移学习】原型引导领域感知渐进表示学习(prototype-guided domain-aware progressiv
    【迁移学习】原型引导领域感知渐进表示学习(prototype-guideddomain-awareprogressiverepresentationlearningPG-DPRL)(二)【迁移学习】原型引导领域感知渐进表示学习(prototype-guideddomain-awareprogressiverepresentationlearningPG-DPRL)(二)文章目录【迁移学......
  • uos 开发笔记
    versionGLIBCXX_3.4.26notfound的问题解决一查看是否有这个库/lib64/libstdc++.so.6二查看这个库/lib64/libstdc++.so.6中的的GLIBCXX的支持的版本 经查看是环境里已经有这个库,并且是个软连接,软连接到libstdc++.so.6.0.19 查看这个库/lib64/libstdc++.so.6中的的GLIBCX......
  • AI - 大模型的类别对比:LLM,Text Embedding,Rerank,Speech to text,TTS
    以下是大模型的几种类别对比:LLM、TextEmbedding、Rerank、SpeechtoText、TTS。LLM(大语言模型)定义:通过在大规模文本数据上进行预训练,学习语言的规律和模式,获得通用语言理解能力和生成能力的模型。特点:参数量大,计算资源需求高。具有强大的语言理解能力和生成能力......
  • AI - ReAct 技术与 Function Call 技术介绍
    ReAct技术与FunctionCall技术介绍1.ReAct技术ReAct是一种用于增强语言模型推理能力的技术,通过在模型的推理过程中引入“思考”(thought)步骤,帮助模型更好地理解和规划下一步行动。核心思想:ReAct在传统的“行动-观察”(action-observation)循环中加入了“思考”步骤,......
  • K8s日志采集终极指南:Logtail + CRD实现多环境精准采集
    需求背景需求:k8s的应用日志解决方案,不同项目组的日志要采集到不同的logstore,并且只采集指定环境的日志(dev/test/prd)方案:logtail使用daemonset方式通过crd来自定义日志采集1.部署helmv3helm:https://github.com/helm/helm/releaseswgethttps://get.helm.sh/helm......
  • Airflow - Study Notes 6
       1.First,wewillsetuptheimportsthatarerequiredforthedashboardview:from__future__importannotationsfromtypingimportTYPE_CHECKINGfromairflow.auth.managers.models.resource_detailsimportAccessViewfromairflow.utils.sessio......
  • Maui学习笔记-系统主题切换
    Maui提供了一种根据当前应用程序主题设置属性的机制,但是它不包含用于在UI中切换主题的组件,需要我们自行创建。创建项目 首先创建一个ThemeInfo类来存储应用程序主题对象及标题。这些对象会在Picker元素中显示。添加CommunityToolkit.Mvvm工具包,创建一个ThemeSettings主......