prompt learning如何计算损失的

时间：2023-05-07 21:22:42浏览次数：48

在prompt learning中,对于一个类别的多个候选词,损失函数通常会计算所有词的logit和,并与真实标签作比较。以情感分类为例:

假设正面类别有两个候选词:“positive”和“optimistic”。负面类别有两个候选词:“negative”和“pessimistic”。
然后模型会计算四个词的logit:logit_positive, logit_optimistic, logit_negative, logit_pessimistic。
如果真实标签是正面,则计算总的正面logit: logit_positive + logit_optimistic。如果这个总logit大于负面总logit logit_negative + logit_pessimistic,则视为正确分类。
如果分类错误,则使用交叉熵损失函数计算四个词的损失,并 backpropagate。

所以简而言之,prompt learning在一类里有多个候选词的情况下,会将这些词的logit加总,并与其他类别的logit总和比较,以进行分类和计算损失。这相当于在训练的时候,多个候选词代表同一个意思,模型需要学会将它们的logit加总以表示这个意思。

该方法有一个好处是可以让模型在推理时选择最匹配的那个候选词,而不局限于训练数据中出现过的候选词。但同时也增加了一定的难度,模型需要理解不同的词在表达同一个意思。但随着训练,模型可以逐渐学会こ这一点。

标签：logit,prompt,learning,候选词,损失,计算
From： https://www.cnblogs.com/douzujun/p/17380186.html

ChatGPT-Prompts使用指南
1.StandardPromptsStandardpromptscanbecombinedwithothertechniqueslikerolepromptingandseed-wordpromptingtoenhancetheoutputofChatGPT.......
论文解读（ID-MixGCL）《ID-MixGCL: Identity Mixup for Graph Contrastive Learning》
论文信息论文标题：ID-MixGCL:IdentityMixupforGraphContrastiveLearning论文作者：GehangZhang.....论文来源：2023aRxiv论文地址：download 论文代码：download视屏讲解：click介绍 ......
Heuristic-Guided Reinforcement Learning
发表时间：2021(NeurIPS2021)文章要点：这篇文章提出了一个Heuristic-GuidedReinforcementLearning(HuRL)的框架，用domainknowledge或者offlinedata构建heuristic，将问题变成一个shorter-horizon的子问题，从而更容易解决。具体的，就是将原始的MDP变换成一个新的reward和gamma的M......
Medicine River ————-Learning journals 9
Deardairy. 20206MayHey,Harlan,longtimenosee.Howhaveyoubeenlately?I'vebeenquitebusylately.Ihopeyoudon'tblamemefornotcomingtoseeyo......
ChatGPT最全提示词Prompts总结，看这一篇就够了！
以下几乎涵盖了各类人群想要使用ChatGPT的所有提示词，需要的朋友可以直接复制粘贴使用。从翻译到整理耗费超过2个小时，如果内容对大家有帮助，请不要吝啬你们的喜欢、点赞、关注~如何正确的提问？担任创业技术律师我将要求您准备一页纸的设计合作伙伴协议草案，该协议是一家拥有I......
《花雕学AI》31：ChatGPT--用关键词/咒语/提示词Prompt激发AI绘画的无限创意！
你有没有想过用AI来画画？ChatGPT是一款基于GPT-3的聊天模式的AI绘画工具，它可以根据你输入的关键词/咒语/提示词Prompt来生成不同风格和主题的画作。Prompt是一些简短的文字，可以用来指导ChatGPT的创作过程。在这篇文章中，我将展示一些用ChatGPT和不同的Prompt创造出来的有趣和创意的A......
Robust Deep Reinforcement Learning against Adversarial Perturbations on State Ob
郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！NeurIPS2020 ......
Learning A Single Network for Scale-Arbitrary Super-Resolution
LearningASingleNetworkforScale-ArbitrarySuper-Resolutionabstract现有的singleimageSR网络是为具有特定整数比例因子（例如，×2/3/4）的图像开发的，无法处理非整数和非对称SR。在本文中，作者建议从特定比例的网络中学习任意比例的图像SR网络。introduction由于上采样......
从代码上解析Meta-learning
文章目录1.背景2.Meta-learning理解2.1Meta-learning到底做什么2.2MAML算法2.3MAML算法步骤2.4MAML代码分析和实现3.参考文章1.背景meta-learning区别于pretraining，它主要通过多个task来学习不同任务之间的内在联系，通俗点说，也即是通过多个任务来学习共同的参数。举个例子，人类在......
iOS MachineLearning 系列（10）—— 自然语言分析之文本拆解
iOSMachineLearning系列（10）——自然语言分析之文本拆解本系列的前几篇文章介绍了iOS中有关图像和视频处理的API，视觉处理主要有Vision框架负责，本篇起，将介绍在iOS中MachineLearning领域相关的自然语言处理框架：NaturalLanguage。1-简介NaturalLanguage是iOS种提供的一种处理自......

prompt learning如何计算损失的

相关文章

赞助商

阅读排行