首页 > 其他分享 >Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions

Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions

时间:2023-07-20 21:44:14浏览次数:46  
标签:Multi Knowledge Lost Rides 信息 Intensive 维基百科 LLM Mack

目录

Trivedi H., Balasubramanian N., Khot T., Sabharwal A. Interleaving retrieval with chain-of-thought reasoning for knowledge-intensive multi-step questions. ACL, 2023.

CoT (Chain of Thought) + 检索.

IRCoT

  • 对于如上的问题, "In what country was Lost Gravity manufactured?" 单独问 LLM 或者单独在维基百科上搜索, 都很难得到答案. 但是通过如下步骤或许可以得到最终的答案:

    1. 首先将该问题在维基百科上搜索, 得到关于 《Lost Gravity》 的一些信息.
    2. LLM 能够从该信息中抓取到 《Lost Gravity》 的制作公司为 Mack Rides.
    3. 接着在维基百科中搜索 "The Lost Gradvity was manufactured by Mack Rides", 我们会得到一些关于 Mack Rides 的信息.
    4. 基于该信息我们能够得到 (通过 LLM 抓取) "Mack Rides" 是一家德国公司的信息.
    5. 最终我们能够得到答案为: Germany.
  • 上面的例子就是告诉我们, 很多问题是需要检索 + 提取信息交替进行最后才能得到答案的.

  • 所以 IRCoT 的步骤就是迭代如下的过程:
    1. 已经有了外部的信息和思维链如下:

    2. 将该 prompt 喂入 LLM 得到输出, 并保留第一行, 若输出中带有 "answer is" 则停止 (或者迭代次数达到上限的时候也停止).

    3. 将这第一行通过检索器检索出一些额外的信息, 再次进入 1.

代码

[official]

标签:Multi,Knowledge,Lost,Rides,信息,Intensive,维基百科,LLM,Mack
From: https://www.cnblogs.com/MTandHJ/p/17569775.html

相关文章

  • 题解 POJ3318【Matrix Multiplication】
    postedon2022-10-2119:56:08|under题解|sourceproblem判断三个\(n\timesn\)的矩阵是否满足\(A\timesB=C\),\(n\leq500\)。solution随机一个行向量\(v\)。若\(a\timesb=c\),则有\(v\timesa\timesb=v\timesc\)(不充分)。显然相乘复杂度仅为\(O(n^2)\)。类似于......
  • Android编译报错Caused by: java.lang.RuntimeException: Manifest merger failed wit
    Android编译报错Causedby:java.lang.RuntimeException:Manifestmergerfailedwithmultiple这种异常一般是引用了aar,如果项目中的manifestapplication配置和aar中不一样就会报错,比如android:icon和aar中不一致,则添加tools:replace="android:icon"配置即可。......
  • MIT 6.S081 Multiprocessors and locking
    whylock防止多核并行运行下的racecondition导致的错误。内核中的数据是典型的concurrently-accessed的数据。raceconditionandhowthelockavoiditAraceconditionisasituationinwhichamemorylocationisaccessedconcurrently,andatleastoneaccess......
  • 大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Mu
    大语言模型的预训练[3]之PromptLearning:PromptEngineering、Answerengineering、Multi-promptlearning、Trainingstrategy详解1.PromptLearning1.1PromptLearning的出现背景目前学术界一般将NLP任务的发展分为四个阶段,即NLP四范式::第一范式:传统机器学习模型的范......
  • 大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Mu
    大语言模型的预训练[3]之PromptLearning:PromptEngineering、Answerengineering、Multi-promptlearning、Trainingstrategy详解1.PromptLearning1.1PromptLearning的出现背景目前学术界一般将NLP任务的发展分为四个阶段,即NLP四范式::第一范式:传统机器学习模型的范......
  • Multi Paxos 、Raft 、ZAB 算法
    参考:凤凰架构:https://icyfenix.cn/distribution/consensus/raft.html 一、将共识问题分解为三个问题1.选主《https://www.cnblogs.com/suBlog/p/17554677.html》BasicPaxos的活锁问题,两个提案节点互不相让地争相提出自己的提案,抢占同一个值的修改权限,导致整个系统在持续......
  • Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
    目录概符号说明RAGRetriever:DPRGenerator:BARTLewisP.andPerezE.,etal.Retrieval-augmentedgenerationforknowledge-intensivenlptasks.NIPS,2020.概RAG:赋予模型检索的能力.符号说明\(\bm{x}\),输入序列;\(\bm{y}\),输出序列,长度为\(N\);RAG......
  • 粗读Multi-Task Recommendations with Reinforcement Learning
    论文:Multi-TaskRecommendationswithReinforcementLearning地址:https://arxiv.org/abs/2302.03328摘要Inrecentyears,Multi-taskLearning(MTL)hasyieldedimmensesuccessinRecommenderSystem(RS)applications[41].However,currentMTL-basedrecommendati......
  • spark SLF4J: Class path contains multiple SLF4J bindings.
    解决"sparkSLF4J:ClasspathcontainsmultipleSLF4Jbindings."问题1.概述当在Spark应用程序中出现"sparkSLF4J:ClasspathcontainsmultipleSLF4Jbindings."错误时,这意味着在类路径上存在多个SLF4J绑定。SLF4J是一个日志框架,用于在应用程序中记录日志。这个......
  • Python的多线程(threading)与多进程(multiprocessing )
    可以用来做后台任务,可以在djangoview中调用,当做异步任务考核系统中要的threading,用来异步考核结果和考核进度的统计Python的多线程(threading)与多进程(multiprocessing)......