首页 > 其他分享 >大模型的思维链提示

大模型的思维链提示

时间:2024-11-09 20:18:34浏览次数:6  
标签:思维 输出 提示 模型 step 推理 输入

文章目录

    思维链提示是一种高级提示策略,旨在增强大语言模型在各类复杂推理任务上的表现。常见的推理任务包括算术推理、常识推理以及符号推理等多种任务。与上下文学习方法仅使用⟨输入,输出⟩二元组来构造提示不同,思维链提示进一步融合了中间的推理步骤来指导从输入到输出的推理过程。下图展示了一个思维链提示的具体例子。
在这里插入图片描述
一个关于上下文学习和思维链提示的比较说明

思维链提示的基本形式

    思维链提示作为上下文学习的一种扩展形式,将原始的⟨输入,输出⟩映射关系转换为⟨输入,思维链,输出⟩这一三元组形式。在这个结构中,思维链扮演着重要的角色,它提供了一系列语义连贯且具有逻辑性的中间推理步骤,有效地建立起输入与输出之间的桥接关系。在思维链提示的作用下,大语言模型可以根据输入生成对应的思维链及答案。然而,与简单的⟨输入,输出⟩二元组相比,思维链的获取通常更为复杂,往往需要借助人工标注的方式。目前有一些简单的方法可以让大模型在回答问题之前生成思考过程。例如,通过向大语言模型提供诸如“Let’s think step by step.”或 “Take a deep breath and work on this problem step-by-ste

标签:思维,输出,提示,模型,step,推理,输入
From: https://blog.csdn.net/weixin_43961909/article/details/143650371

相关文章

  • 基于大语言模型的规划
    文章目录整体框架方案生成反馈获取    虽然上下文学习和思维链提示方法形式上较为简洁且较为通用,但是在面对诸如几何数学求解、游戏、代码编程以及日常生活任务等复杂任务时仍然表现不佳。为了解决这类复杂任务,可以使用基于大语言模型的规划(Planning)。该......
  • 大模型的会终结程序员面试八股文的情况吗?
    先说结论,很遗憾的是,即便大模型已经完全能回答几乎100%的面试八股文,即便面试八股文对工作中几乎没有任何帮助,但是今后的面试中,依然充斥的八股文,依然是主流。大语言模型改变了今后的软件开发流程大语言模型的出现正在悄然改变软件开发的面貌,尤其是像ChatGPT4OwithCanvas......
  • 扩写、仿写、润色、绘本创作等写作类提示词
    什么是提示词?提示词的英文是Prompt,是你与人工智能(AI)进行交流的方式。简单来说,提示词就是你给AI的一段文字或问题,AI根据这段文字或问题来生成回应或完成任务。举个例子:假设你在使用一个聊天机器人,你可以输入一句话,比如:“今天的天气怎么样?”这句话就是一个提示词。AI会根据这......
  • 51c大模型~合集20
    我自己的原文哦~ https://blog.51cto.com/whaosoft/11634780#Transformer大模型尺寸变化大模型尺寸正在重走CNN的老路;马斯克:在特斯拉也是这样, Transformer大模型尺寸变化,正在重走CNN的老路! Transformer大模型尺寸变化,正在重走CNN的老路!看到大家都被LLaMA3.1吸引了注......
  • 51c大模型~合集19
    我自己的原文哦~  https://blog.51cto.com/whaosoft/11622380#用苹果VisionPro隔空操控机器人黄仁勋表示:「AI的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。」如今,ProjectGR00T又迈出了重要的一步。昨日,英伟达创始人黄仁勋在SIGGRAPH2024Keynote......
  • 万字长文深度解读Movie Gen技术原理(5部曲):图像&视频联合生成模型 (2)
    ​引言简介图像和视频基础模型时间自编码器(TAE)训练目标骨干架构文本嵌入和视觉-文本生成空间上采样模型扩展和训练效率预训练预训练数据训练微调STF微调数据集创建监督微调&模型平均推理推理提示重写提高推理效率评估评估维度评估......
  • 基于YOLOV8模型的道路瑕疵目标检测系统(PyTorch+Pyside6+YOLOv8模型)
    摘要:基于YOLOV8模型的道路瑕疵目标检测系统可用于日常生活中检测与定位道路瑕疵目标,利用深度学习算法可实现图片、视频、摄像头等方式的目标检测,另外本系统还支持图片、视频等格式的结果可视化与结果导出。本系统采用YOLOv8目标检测算法训练数据集,使用Pysdie6库来搭建前端页面......
  • DE-9IM 空间关系模型
    参考博客:空间拓扑关系描述:9交叉模型(DE-9IM)|会飞的大象DE-9IM空间关系模型-乌合之众-博客园DE-9IM空间关系模型与BoostGeometryLib-SuperVan-博客园简述DE-9IM是DimensionallyExtended9-IntersectionModel的缩写,它是Egenhofer在《pointsettopologic......
  • 程序的内存模型
    内存分区模型C++程序在执行时,将内存大致分为4个区域。1.代码区:存放函数体的二进制代码,由操作系统进行管理。2.全局区:存放全局变量和静态变量以及常量。3.栈区:由编译器自动分配释放,存放函数的参数值,局部变量等。4.堆区:由程序员分配和释放,若程序员不释放,程序结束时由操作系统......
  • 网络IO模型
    5个IO模型阻塞IO,异步IO,信号驱动IO,多路复用IO,异步IO一个IO操作的组成(1)发起IO请求(2)执行具体的IO操作同步和异步的区别第二步是否阻塞。如果发起IO请求后进程阻塞直到IO完成,就是同步IO;反之,如果进程发起IO请求后可以去执行其它事,等IO完了再处理,就是异步IO。阻塞IO和非阻塞IO的区......