首页 > 其他分享 >NLP论文速读|DDCoT: Duty-Distinct Chain-of-Thought Prompting for Multimodal Reasoning in Language Models

NLP论文速读|DDCoT: Duty-Distinct Chain-of-Thought Prompting for Multimodal Reasoning in Language Models

时间:2024-11-02 09:17:41浏览次数:3  
标签:Duty NLP DDCoT 速读 LLMs 模型 论文 模态 推理

论文速读|Duty-distinct chain-of-thought prompting for multimodal reasoning in language models

论文信息:

图片

简介:

      论文探讨了如何使大型语言模型(LLMs)在多模态环境中进行复杂的推理,这一直是人工智能系统的长期目标。尽管最近的研究表明,通过模仿人类思维过程的“思维链”(Chain of Thought,简称CoT)可以显著提高LLMs在纯语言模态上的多步推理能力,但将这些进步转移到涉及图像和语言的多模态环境中面临着更高的挑战,包括劳动密集型的标注需求、灵活性、泛化能力和可解释性的限制。针对该问题,论文试图解决的问题是如何在多模态环境中激发CoT推理,特别是在多模态CoT推理中保持批判性思维和合理分配推理与识别任务的挑战。为了应对这些挑战,论文提出了两个关键的洞见:“保持批判性思维”和“让每个人各司其职”。

论文方法:

图片

      论文提出了一种新颖的DDCoT(Duty-Distinct Chain-of-Thought Prompting)提示方法,该方法通过负面空间提示维持批判性态度,并通过将LLMs的推理责任划分为推理和识别,然后将视觉模型的视觉识别能力整合到联合推理过程中,从而将多模态性纳入推理。DDCoT生成的理由不仅提高了大型和小型企业语言模型在零样本提示和微调学习中的推理能力,显著优于最先进的方法,而且还展示了出色的泛化能力和可解释性。论文还详细介绍了如何利用生成的理由来促进LLMs的多模态问题回答,包括在零样本提示和微调学习中的应用。

论文实验:

图片

      实验分为两个主要部分:零样本(Zero-shot)学习和微调(Fine-tuning)学习。

      1.     零样本学习

      在这部分,研究者们测试了DDCoT方法在没有经过特定训练的情况下,直接将生成的理由(rationales)与问题陈述结合起来,作为输入提供给大型语言模型(LLMs),如ChatGPT和GPT-3。实验结果显示,DDCoT方法能够显著提高模型在图像相关问题上的性能,与现有的最先进方法相比,平均性能分别提高了2.53%和8.23%。

      2.     微调学习

      在微调设置中,研究者们进一步探索了如何利用生成的理由来改善模型对多模态输入的理解。他们提出了深度层提示(Deep-Layer Prompting, DLP)和理由压缩视觉嵌入(Rational-Compressed Visual Embedding, RCVE)两种技术,以改善跨模态信息的对齐和联合推理。实验结果表明,这些技术能够有效提高模型在多模态推理任务中的性能。

论文链接:

https://arxiv.org/abs/2310.16436

原文来自:

论文速读|Ddcot

标签:Duty,NLP,DDCoT,速读,LLMs,模型,论文,模态,推理
From: https://blog.csdn.net/2401_85576118/article/details/143428559

相关文章

  • NLP segment-03-基于 TF-IDF 实现关键词提取 java 开源实现
    拓展阅读分词系列专题jieba-fenci01结巴分词原理讲解segmentjieba-fenci02结巴分词原理讲解之数据归一化segmentjieba-fenci03结巴分词与繁简体转换segmentjieba-fenci04结巴分词之词性标注实现思路speechTaggingsegment关键词系列专题NLPsegment-01-聊一聊......
  • POLIR-Mind-Cognition-Neural Models-NLP(Neural Logic Levels) 思维逻辑层级-能给你
    百知思维模型-NLP理解层次能给你无敌洞察力https://v.douyin.com/iS74bMKr/POLIR-Mind-CognitionNeuralModelsNLP(NeuralLogicLevels)思维逻辑层级能给你无敌洞察力GregoryBertson(格雷歌理,贝特森)RobertDiertz(罗伯特,迪尔磁)终于在1991年成为理解问题和解决问题......
  • 大型xlsx文件内容快速读取
    openpyxl的性能还是不够用,我经常会导出很多的xlsx文件获取里面的数据来分析操作。下面的代码可以直接将xlsx的文本内容直接转为二维列表返回使用:def获取数据形成二维列表_原封不动版_V2(path:str)->list:zip_file=zipfile.ZipFile(path)monitor_typeName=os.path......
  • 论文速读记录 - 202410
    坚持看论文不容易啊,十月也是多事之秋。看的论文有点少,也有点散,还是要专注一些具体的方向,梳理脉络,整理方案,才是看论文找解决方案的正确思路。以后的每篇论文解读的后面,会附带一点个人看法/评论,如有冒犯还请见谅。目录:LATECHUNKING:CONTEXTUALCHUNKEMBEDDINGSUSINGLONG-C......
  • (30-6)基于NLP用户舆情的交易策略:使用增加嵌入维度的深度学习模型
    30.5.4 使用增加嵌入维度的深度学习模型还有继续提升模型性能的空间,特别是因为我们拥有一个相对较大的数据集,并且数据是由专家进行标注的。嵌入层似乎是构建优秀模型的关键,因此我们将尝试一种使用嵌入层的深度学习方法。我们的深度学习模型将使用20,000的词汇表,并将最大文......
  • 法律智能助手:思通数科开源NLP系统助力文档分类与检索加速
    一、系统概述思通数科AI平台是一款融合了自然语言处理和多标签分类技术的开源智能文档分类工具,特别适用于法律行业。平台采用深度学习的BERT模型来进行特征提取与关系抽取,实现了精准的文档分类和检索。用户可以在线训练和标注数据,使系统持续学习,准确率、召回率等指标随着使用而......
  • 揭秘NLP中的基础特征:句法分析与句法分析器
     欢迎关注我......
  • (30-2)基于NLP用户舆情的交易策略:数据分析
    30.3 数据分析在本项目中,数据分析工作通过结合股票市场数据和新闻标题,构建了一个基于情感分析的交易策略。首先,从YahooFinance获取了多只股票的历史收盘价,然后提取了相关的新闻标题和股票代码。接着,通过计算事件收益,分析新闻发布对股票价格的影响,最终将所有数据合并,以便后......
  • 计算机毕业设计Python+大模型微博情感分析 微博舆情预测 微博爬虫 微博大数据 舆情分
    温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!《Python+大模型微博情感分析》开题报告一、研究背景与意义随着互联网技术的飞速发展,社交媒体平台......
  • 使用 NLP 和模式匹配检测、评估和编辑日志中的个人身份信息 - 第 2 部分
    作者:来自Elastic StephenBrown如何使用Elasticsearch、NLP和模式匹配检测、评估和编辑日志中的PII。简介:分布式系统中高熵日志的普遍存在大大增加了PII(PersonallyIdentifiableInformation-个人身份信息)渗入我们日志的风险,这可能导致安全和合规性问题。这篇由两......