首页 > 其他分享 >SELF-DEMOS: Eliciting Out-of-Demonstration Generalizability in Large Language Models

SELF-DEMOS: Eliciting Out-of-Demonstration Generalizability in Large Language Models

时间:2024-07-19 11:29:43浏览次数:19  
标签:OOD 演示 泛化 Language Models SELF 查询 DEMOS

本文是LLM系列文章,针对《SELF-DEMOS: Eliciting Out-of-Demonstration Generalizability
in Large Language Models》的翻译。

SELF-DEMOS:在大型语言模型中引入非演示泛化能力

摘要

大型语言模型(LLM)已经显示出有前景的情境学习(ICL)能力,只需很少的演示即可快速适应新任务。然而,目前的小样本方法严重依赖于高质量的、特定于查询的演示,而这些演示往往缺乏。当面临演示外(OOD)查询时,依赖于手工演示或外部检索器的方法可能会失败。为了弥合有限演示和面向对象查询之间的差距,我们提出了SELF-demos,这是一种新的提示方法,通过查询感知演示生成来激发LLM中固有的泛化能力。生成的演示在现有演示和给定查询之间进行战略性插值,将查询从OOD转换为ID。为了评估我们方法的有效性,我们手动构建了OODToolset,这是一个工具使用场景中的数据集,有300多个真实世界的API和1000个实例,每个实例由三个工具用例作为演示和一个OOD查询组成。对我们的数据集和两个公共数学基准的彻底实验表明,我们的方法在面向对象设计设置中可以超越最先进的基线。此外,我们还进行了一系列分析,以验证SELF-DEMOS的泛化能力,并提供更多见解。

1 引言

2 相关工作

3 方法

4 实验

5 讨论

6 结论

本文重点研究了在小样本学习场景中解决演示外(OOD)查

标签:OOD,演示,泛化,Language,Models,SELF,查询,DEMOS
From: https://blog.csdn.net/c_cpp_csharp/article/details/140524458

相关文章

  • 易优CMS模板标签modelsartlist频道循环输出顶级栏目列表
    [基础用法]标签:modelsartlist(channelartlist)备注:使用channelartlist也可以正常输出描述:获取当前栏目分类的下级栏目的文档列表用法:{eyou:modelsartlisttypeid='栏目ID'type='son'loop='20'}<ahref='{eyou:fieldname='typeurl'/}'>{eyou:fi......
  • Self-Supervised Learning for Point Clouds Data: A Survey
    摘要综述了自监督学习(SSL)在3D点云数据处理领域的最新进展,对现有SSL方法进行了细致的分类和评估,并在多个基准数据集上对代表性方法进行了性能比较。同时指出了现有研究的局限性,提出了未来研究的方向。Introduction文章主要是针对自监督学习的(SSL),详细阐述了3D点云数据由于其......
  • Self-supervised Learning for Pre-Training 3D Point Clouds: A Survey
    Abstract点云数据由于其紧凑的形式和表示复杂3D结构的灵活性而被广泛研究。点云数据准确捕获和表示复杂3D几何形状的能力使其成为广泛应用的理想选择,包括计算机视觉,机器人技术和自动驾驶,所有这些都需要了解底层空间结构。这种方法旨在从未标记的数据中学习通用和有用的点云表......
  • modelscope上的模型如何下载?
    modelscope上的模型如何下载?在ModelScope(魔搭)上下载模型,用户可以通过多种方式进行,主要包括直接通过网站界面下载、使用SDK(软件开发工具包)下载,以及通过Git方式下载。以下是详细的下载步骤:一、通过网站界面下载   访问ModelScope官网:       打开浏览器,访问ModelScope......
  • 大语言模型(Large Language Models, LLMs)是否需要进行数据校正
    大语言模型(LargeLanguageModels,LLMs),如GPT-3,并不总是免于数据校正的过程。实际上,即使是这些大语言模型,在数据预处理中也会涉及到一定的处理和调整。以下是为什么大语言模型在某些情况下不需要明显的批效应校正,同时在某些情况下仍然需要数据校正的原因:为什么大语言模型不需要显......
  • 大语言模型无法理解链表 Large Language Models Fails to Understand Chained Table[u
    大模型可以翻转链表,但是只能翻转单个元素链表。一但牵扯到分组操作,就不会了。Case:以K个元素为一组位翻转链表,每一组内部元素顺序不变。ReversethechainedtableingroupofKelements,don'tchangetheorderineachgroup. Handwritten: 1classNode():2......
  • Why can‘t I access GPT-4 models via API, although GPT-3.5 models work?
    题意:为什么我无法通过API访问GPT-4模型,尽管GPT-3.5模型可以工作?问题背景:I'mabletousethegpt-3.5-turbo-0301modeltoaccesstheChatGPTAPI,butnotanyofthegpt-4models.HereisthecodeIamusingtotestthis(itexcludesmyopenaiAPIkey).Theco......
  • ATTACKS ON THIRD-PARTY APIS OF LARGE LANGUAGE MODELS
    本文是LLM系列文章,针对《ATTACKSONTHIRD-PARTYAPISOFLARGELANGUAGEMODELS》的翻译。对大型语言模型第三方api的攻击摘要1引言2提出的流水线3实验4结论摘要大型语言模型(LLM)服务最近开始提供一个插件生态系统来与第三方API服务交互。这项创新增强了LLM的能......
  • 机器人前沿--PalmE:An Embodied Multimodal Language Model 具身多模态大(语言)模型
    首先解释这篇工作名称Palm-E,发表时间为2023.03,其中的Palm是谷歌内部在2022.04开发的大语言模型,功能类似ChatGPT,只是由于各种原因没有那样火起来,E是Embodied的首字母,翻译过来就是具身多模态大语言模型大模型,我们一般习惯将其称为具身多模态大模型。何为具身?这个词听起来非常......
  • Transformer模型:Encoder的self-attention mask实现
    前言         这是对Transformer模型的WordEmbedding、PostionEmbedding内容的续篇。视频链接:19、Transformer模型Encoder原理精讲及其PyTorch逐行实现_哔哩哔哩_bilibili文章链接:Transformer模型:WordEmbedding实现-CSDN博客          Transf......