zero-shot-learning-definition-examples-comparison

时间：2024-06-17 21:54:23浏览次数：23

标签：definition shot 训练 comparison 样本 learning 类别斑马

1 Zero-shot learning

零样本学习。

1.1 任务定义

利用训练集数据训练模型，使得模型能够对测试集的对象进行分类，但是训练集类别和测试集类别之间没有交集；期间需要借助类别的描述，来建立训练集和测试集之间的联系，从而使得模型有效。

Zero-shot learning 就是希望我们的模型能够对其从没见过的类别进行分类，让机器具有推理能力，实现真正的智能。其中零次（Zero-shot）是指对于要分类的类别对象，一次也不学习。

1.2 实例

假设我们的模型已经能够识别马，老虎和熊猫了，现在需要该模型也识别斑马，那么我们需要告诉模型，怎样的对象才是斑马，但是并不能直接让模型看见斑马。所以模型需要知道的信息是马的样本、老虎的样本、熊猫的样本和样本的标签，以及关于前三种动物和斑马的描述。

通俗点说就是：假设小暗（纯粹因为不想用小明）和爸爸，到了动物园，看到了马，然后爸爸告诉他，这就是马；之后，又看到了老虎，告诉他：“看，这种身上有条纹的动物就是老虎。”；最后，又带他去看了熊猫，对他说：“你看这熊猫是黑白色的。”然后，爸爸给小暗安排了一个任务，让他在动物园里找一种他从没见过的动物，叫斑马，并告诉了小暗有关于斑马的信息：“斑马有着马的轮廓，身上有像老虎一样的条纹，而且它像熊猫一样是黑白色的。”最后，小暗根据爸爸的提示，在动物园里找到了斑马（意料之中的结局。。。）。

上述例子中包含了一个人类的推理过程，就是利用过去的知识（马，老虎，熊猫和斑马的描述），在脑海中推理出新对象的具体形态，从而能对新对象进行辨认。zero-shot learning就是希望能够模仿人类的这个推理过程，使得计算机具有识别新事物的能力。

2 One-shot learning --单样本学习

Zero-shot learning 指的是我们之前没有这个类别的训练样本。但是我们可以学习到一个映射X->Y。如果这个映射足够好的话，我们就可以处理没有看到的类了。

One-shot learning 指的是我们在训练样本很少，甚至只有一个的情况下，依旧能做预测。这是如何做到呢？可以在一个大数据集上学到general knowledge（具体的说，也可以是X->Y的映射），然后再到小数据上有技巧的update。

2.1 One-Shot Learning的意义

① 减少训练数据

深度学习需要大量的数据
如MNIST为了10个类别的区分，需要60000张训练图像，平均一个类别需要6000张训练图像。

One-Shot试图将一个类别的训练图像减少，极端情况时只有一张图片。

② 在新类别的数据出现时，无需重新训练

传统的神经网络无法处理没有出现在训练集中的类别。

如以员工刷脸打卡为例，使用深度神经网络，每一个新员工入职，都是一个类别，需要重新训练深度神经网络。如果每天都有新员工入职，每天都要重新训练网络，成本非常高。

One-Shot Learning可以无需重新训练即可应用于新的类别的数据

One-shot learning 属于Few-shot learning的一种特殊情况。

3 Few-shot learning

小样本学习。

如果训练集中，不同类别的样本只有少量，则成为Few-shot learning.

就是给模型待预测类别的少量样本，然后让模型通过查看该类别的其他样本来预测该类别。比如：给小孩子看一张熊猫的照片，那么小孩子到动物园看见熊猫的照片之后，就可以识别出那是熊猫。

Few-shot Learning V.S Zero-shot Learning

小样本学习的目的是在有少量训练数据的情况下能获得准确分类测试样本的模型
零样本学习的目的是预测训练数据集中没有出现过的类

零样本学习和小样本学习有很多共同的应用，如：

图像分类(image classification)
语义分割(semantic segmentation)
图像生成(image generation)
目标检测(object detection)
自然语言处理(natural language processing)

另外单样本学习(one-shot learning)经常会和零样本学习混在一起。单样本学习是小样本学习问题的一个特例，它的目的是从一个训练样本或图片中学习到有关物体类别的信息。单样本学习的一个例子是，智能手机中使用的人脸识别技术。

本文由博客一文多发平台 OpenWrite 发布！

标签：definition,shot,训练,comparison,样本,learning,类别,斑马
From： https://www.cnblogs.com/JavaEdge/p/18253289

论文解读——EMNLP2023《Cross-lingual Prompting: Improving Zero-shot Chain-of-Tho
一、研究背景本研究聚焦于改进跨语言链式思考（Chain-of-Thought,CoT）推理，这是针对大型语言模型（LLMs）推理过程中的一种技术。传统上，链式思考通过引导模型按步骤生成推理路径，以提高推理任务的准确性。具体来说，零样本链式思考（zero-shotCoT）通过简单的提示，如“Let’sthinks......
Spring中GenericBeanDefinition属性
1.id再Spring容器中作为Bean的唯一标识2.name用于为id属性创建一个或多个别名，用空格、逗号分开3.classBean的类名，全限定名primary多个相同Bean再容器中的优先级5.parent标注该Bean的父类Bean，继承父类Bean的所有属性6.abstract标注Bean是否是抽象的，一般用于父类Bean。......
论文解读——CVPR2024《Learning by Correction: Efficient Tuning Task for Zero-Sho
一、研究背景视觉-语言模型是一类能够处理和理解图像及其相关文本信息的模型，它们在多种视觉-语言任务中展示了卓越的性能。这些任务包括图像描述（imagecaptioning）、视觉问题回答（visualquestionanswering）、图像-文本检索（image-textretrieval）等。这些模型通常经过大规......
Vision-Language Models are Zero-Shot Reward Models for Reinforcement Learning
发表时间：2024(ICLR2024)文章要点：文章提出用预训练的视觉语言模型作为zero-shot的rewardmodel（VLM-RMs）。好处在于可以通过自然语言来给定一个具体的任务，通过VLM-RMs让强化学习基于reward学习这个任务（usingpretrainedvision-languagemodels(VLMs)aszeroshotrewardmodels......
server-1.0-SNAPSHOT.jar中没有主清单属性
server-1.0-SNAPSHOT.jar中没有主清单属性问题出在<pluginManagement></pluginManagement>标签内部插件配置无效，导致spring-boot-maven-plugin未生效。因此，在执行mvncleanpackage后，尝试运行JAR文件时会出现错误。解决方法是移除<pluginManagement>标签，直接在<build>......
BeanDefinition的资源定位过程
正文当我们传入一个Spring配置文件去实例化FileSystemXmlApplicationContext时，可以看一下它的构造方法都做了什么。/***下面这4个构造方法都调用了第5个构造方法*@paramconfigLocation*@throwsBeansException*///configLocation包含了BeanDefiniti......
TexQ: Zero-shot Network Quantization with Texture Feature Distribution Calibrati
我们使用以下这六个标准对网络量化和相关领域的研究进行分类。以下是每个标准的详细解释，并结合了参考文献中的相关研究：研究领域：该标准将研究大致分为三个主要领域：量化：这是上传论文的核心焦点。它涉及减少模型参数的位宽（例如，从32位浮点数到4位整数）等技术，以压缩模型并提......
Large Language Models are Zero-Shot Rankers for Recommender Systems论文阅读笔记
LargeLanguageModelsareZero-ShotRankersforRecommenderSystems论文阅读笔记Abstract 本工作旨在调查作为推荐系统的排名模型的LLM的能力。我们首先将推荐问题形式化为一个条件排序任务，将顺序交互历史作为条件，并将其他候选生成模型检索到的项目作为候选项。为了解决LL......
[论文阅读] FontDiffuser@ One-Shot Font Generation via Denoising Diffusion with M
Pretitle:FontDiffuser:One-ShotFontGenerationviaDenoisingDiffusionwithMulti-ScaleContentAggregationandStyleContrastiveLearningaccepted:AAAI2024paper:https://arxiv.org/abs/2312.12142code:https://github.com/yeungchenwa/FontDiffuserref:......
DDL（Data Definition Language）数据定义语句
DDL语句的主要作用是定义或修改数据表的结构或数据类型。数据表的创建：CREATETABLE{表名}({字段名}{数据类型}{限制条件1}{限制条件2}...,{字段名}{数据类型}{限制条件1}{限制条件2}...);注：*每个字段之间需要写逗号*限制条件可以不加示例：#创......