SELF-DEMOS: Eliciting Out-of-Demonstration Generalizability in Large Language Models

时间：2024-07-19 11:29:43浏览次数：19

标签：OOD 演示泛化 Language Models SELF 查询 DEMOS

本文是LLM系列文章，针对《SELF-DEMOS: Eliciting Out-of-Demonstration Generalizability
in Large Language Models》的翻译。

SELF-DEMOS：在大型语言模型中引入非演示泛化能力

摘要
1 引言
2 相关工作
3 方法
4 实验
5 讨论
6 结论
局限性

摘要

大型语言模型（LLM）已经显示出有前景的情境学习（ICL）能力，只需很少的演示即可快速适应新任务。然而，目前的小样本方法严重依赖于高质量的、特定于查询的演示，而这些演示往往缺乏。当面临演示外（OOD）查询时，依赖于手工演示或外部检索器的方法可能会失败。为了弥合有限演示和面向对象查询之间的差距，我们提出了SELF-demos，这是一种新的提示方法，通过查询感知演示生成来激发LLM中固有的泛化能力。生成的演示在现有演示和给定查询之间进行战略性插值，将查询从OOD转换为ID。为了评估我们方法的有效性，我们手动构建了OODToolset，这是一个工具使用场景中的数据集，有300多个真实世界的API和1000个实例，每个实例由三个工具用例作为演示和一个OOD查询组成。对我们的数据集和两个公共数学基准的彻底实验表明，我们的方法在面向对象设计设置中可以超越最先进的基线。此外，我们还进行了一系列分析，以验证SELF-DEMOS的泛化能力，并提供更多见解。

1 引言

2 相关工作

3 方法

4 实验

5 讨论

6 结论

本文重点研究了在小样本学习场景中解决演示外（OOD）查

标签：OOD,演示,泛化,Language,Models,SELF,查询,DEMOS
From： https://blog.csdn.net/c_cpp_csharp/article/details/140524458

易优CMS模板标签modelsartlist频道循环输出顶级栏目列表
[基础用法]标签：modelsartlist（channelartlist）备注：使用channelartlist也可以正常输出描述：获取当前栏目分类的下级栏目的文档列表用法：{eyou:modelsartlisttypeid='栏目ID'type='son'loop='20'}<ahref='{eyou:fieldname='typeurl'/}'>{eyou:fi......
Self-Supervised Learning for Point Clouds Data: A Survey
摘要综述了自监督学习（SSL）在3D点云数据处理领域的最新进展，对现有SSL方法进行了细致的分类和评估，并在多个基准数据集上对代表性方法进行了性能比较。同时指出了现有研究的局限性，提出了未来研究的方向。Introduction文章主要是针对自监督学习的（SSL），详细阐述了3D点云数据由于其......
Self-supervised Learning for Pre-Training 3D Point Clouds: A Survey
Abstract点云数据由于其紧凑的形式和表示复杂3D结构的灵活性而被广泛研究。点云数据准确捕获和表示复杂3D几何形状的能力使其成为广泛应用的理想选择，包括计算机视觉，机器人技术和自动驾驶，所有这些都需要了解底层空间结构。这种方法旨在从未标记的数据中学习通用和有用的点云表......
modelscope上的模型如何下载？
modelscope上的模型如何下载？在ModelScope（魔搭）上下载模型，用户可以通过多种方式进行，主要包括直接通过网站界面下载、使用SDK（软件开发工具包）下载，以及通过Git方式下载。以下是详细的下载步骤：一、通过网站界面下载访问ModelScope官网：打开浏览器，访问ModelScope......
大语言模型（Large Language Models, LLMs）是否需要进行数据校正
大语言模型（LargeLanguageModels,LLMs），如GPT-3，并不总是免于数据校正的过程。实际上，即使是这些大语言模型，在数据预处理中也会涉及到一定的处理和调整。以下是为什么大语言模型在某些情况下不需要明显的批效应校正，同时在某些情况下仍然需要数据校正的原因：为什么大语言模型不需要显......
大语言模型无法理解链表 Large Language Models Fails to Understand Chained Table[u
大模型可以翻转链表，但是只能翻转单个元素链表。一但牵扯到分组操作，就不会了。Case:以K个元素为一组位翻转链表，每一组内部元素顺序不变。ReversethechainedtableingroupofKelements,don'tchangetheorderineachgroup. Handwritten: 1classNode():2......
Why can‘t I access GPT-4 models via API, although GPT-3.5 models work?
题意：为什么我无法通过API访问GPT-4模型，尽管GPT-3.5模型可以工作？问题背景：I'mabletousethegpt-3.5-turbo-0301modeltoaccesstheChatGPTAPI,butnotanyofthegpt-4models.HereisthecodeIamusingtotestthis(itexcludesmyopenaiAPIkey).Theco......
ATTACKS ON THIRD-PARTY APIS OF LARGE LANGUAGE MODELS
本文是LLM系列文章，针对《ATTACKSONTHIRD-PARTYAPISOFLARGELANGUAGEMODELS》的翻译。对大型语言模型第三方api的攻击摘要1引言2提出的流水线3实验4结论摘要大型语言模型（LLM）服务最近开始提供一个插件生态系统来与第三方API服务交互。这项创新增强了LLM的能......
机器人前沿--PalmE：An Embodied Multimodal Language Model 具身多模态大(语言)模型
首先解释这篇工作名称Palm-E，发表时间为2023.03，其中的Palm是谷歌内部在2022.04开发的大语言模型，功能类似ChatGPT，只是由于各种原因没有那样火起来，E是Embodied的首字母，翻译过来就是具身多模态大语言模型大模型，我们一般习惯将其称为具身多模态大模型。何为具身？这个词听起来非常......
Transformer模型：Encoder的self-attention mask实现
前言这是对Transformer模型的WordEmbedding、PostionEmbedding内容的续篇。视频链接：19、Transformer模型Encoder原理精讲及其PyTorch逐行实现_哔哩哔哩_bilibili文章链接：Transformer模型：WordEmbedding实现-CSDN博客 Transf......