首页 > 其他分享 >Self-consistency Improves Chain of Thought Reasoning in Language Models 论文阅读

Self-consistency Improves Chain of Thought Reasoning in Language Models 论文阅读

时间:2023-05-29 23:14:16浏览次数:53  
标签:Language Chain Models Thought 答案 consistency 推理

ICLR 2023 原文地址

1. Motivation

Chain-of-Thought(CoT)使Large Language Models(LLMs)在复杂的推理任务中取得了令人鼓舞的结果。
本文提出了一种新的解码策略——self-consistency,以取代贪婪解码。
self-consistency利用了一种直觉,即一个复杂的推理问题通常允许多种不同的思维方式推导出同一个正确答案。

2. Procedure

  1. 首先从语言模型的解码器中采样,生成一组不同的推理路径
  2. 每个推理路径可能导致不同的最终答案,通过边缘化(marginalizing out)这些推理路径来确定最优答案,即最一致的答案。
    这种方法类似于人类的经验,如果多种不同的思维方式导致相同的答案,一个人更有信心最终的答案是正确的。
image-20230321155539760

To be continue...

标签:Language,Chain,Models,Thought,答案,consistency,推理
From: https://www.cnblogs.com/jjvv/p/17441952.html

相关文章

  • EmbodiedGPT: Vision-Language Pre-Training via Embodied Chain of Thought
     Abstract:具身人工智能(Embodied AI)让机器人有规划、执行动作序列的能力,以在物理环境中完成长期任务。本文提出EmbodiedGPT,它是一个端到端的多模态基础模型,赋予具身代理多模态理解和执行能力。本文的贡献主要有三点:制作了一个大规模的具身规划数据集EgoCOT。该数据集包含......
  • SQL(Structured Query Language)介绍及查询示例
    SQL(StructuredQueryLanguage)是结构化查询语言的缩写,它是一种专门用于操作关系型数据库的编程语言。SQL可以用于数据的存储、查询、更新、删除等常见操作,并且是目前世界上最流行的关系型数据库操作语言。SQL的主要特点包括:1.简单易学:SQL的语法清晰简单,易于学习和使用。2.......
  • vivado2019.2对modelsim2019.2编译库全报错解析
    最近在用vivado2019.2编译modelsim2019.2库时,所有库全部报错,查阅了博主们的各种解决办法,最终在一篇文章的评论中找到了解决办法,特此记录问题描述:1、ERROR:[Vivado12-5602]compile_simlibfailedtocompileformodelsimwitherrorinxxxlibraries2、ERROR:[Common17-......
  • LangChain学习笔记1:基本概念
    GPT:x中之事,事无大小,悉以咨之概念加载器(Loader)从某种介质中获取数据,即加载。文档(Document)数据转换成文档进行处理。类比数据库转换成记录……文本分割(TextSpltter)LLM一次处理的数据有限,分割成多批进行处理。向量数据库(Vectorstores)文档转换成向量,把文档存入到向量数据库,自动转换成......
  • [论文阅读] Diffusion Models Beat GANs on Image Synthesis
    Pretitle:DiffusionModelsBeatGANsonImageSynthesisaccepted:NeurIPS2021paper:https://arxiv.org/abs/2105.05233code:https://github.com/openai/guided-diffusionref:https://sunlin-ai.github.io/2022/05/30/guided-diffusion.htmlref:https://blog.cs......
  • 论文解析 -- A Survey of Large Language Models
     什么是语言模型?生成式,完成语言接龙或填空Technically,languagemodeling(LM)isoneofthemajorapproachestoadvancinglanguageintelligenceofmachines.Ingeneral,LMaimstomodelthegenerativelikelihoodofwordsequences,soastopredictthepro......
  • AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models
    AbstractEvaluatingthegeneralabilitiesoffoundationmodelstotacklehuman-leveltasksisavitalaspectoftheirdevelopmentandapplicationinthepursuitofArtificialGeneralIntelligence(AGI).Traditionalbenchmarks,whichrelyonartificialdat......
  • CLIP-S^4:Language-Guided Self-Supervised Semantic Segmentation论文阅读笔记
    摘要作者提出了CLIP-S4,借助自监督像素表示学习和V-L模型实现各种语义分割任务,不需要使用任何像素级别标注以及未知类的信息。作者首先通过对图像的不同增强视角进行像素-分割对比学习来学习像素嵌入。之后,为进一步改善像素嵌入并实现基于自然语言的语义分割,作者设计了由V-L模型指......
  • Combining Label Propagation and Simple Models Out-performs Graph Neural Networks
    目录概符号说明C&S代码HuangQ.,HeH.,SinghA.,LimS.andBensonA.R.Combininglabelpropagationandsimplemodelsout-performsgraphneuralnetworks.ICLR,2021.概将预测概率作为信号进行传播.符号说明\(G=(V,E)\),图;\(|V|=n\);\(X\in\mathbb{R}......
  • iOS的KeyChain(钥匙串)的使用
    iOS的KeyChain(钥匙串)的使用Keychain钥匙串存储账号和密码,还可以多个应用之间分享此账号和密码,只需要配置一项,如下一张图片-1.iOS的keychain提供一种安全保存信息的方式,-2.可以保存密码等数据,而且keychain中的数据不会因为你删除app而丢失,-3.你可以在重新......