首页 > 其他分享 >prompt learning如何计算损失的

prompt learning如何计算损失的

时间:2023-05-07 21:22:42浏览次数:48  
标签:logit prompt learning 候选词 损失 计算

在prompt learning中,对于一个类别的多个候选词,损失函数通常会计算所有词的logit和,并与真实标签作比较。以情感分类为例:

  • 假设正面类别有两个候选词:“positive”和“optimistic”。负面类别有两个候选词:“negative”和“pessimistic”。
  • 然后模型会计算四个词的logit:logit_positive, logit_optimistic, logit_negative, logit_pessimistic。
  • 如果真实标签是正面,则计算总的正面logit: logit_positive + logit_optimistic。如果这个总logit大于负面总logit logit_negative + logit_pessimistic,则视为正确分类。
  • 如果分类错误,则使用交叉熵损失函数计算四个词的损失,并 backpropagate。

所以简而言之,prompt learning在一类里有多个候选词的情况下,会将这些词的logit加总,并与其他类别的logit总和比较,以进行分类和计算损失。这相当于在训练的时候,多个候选词代表同一个意思,模型需要学会将它们的logit加总以表示这个意思。

该方法有一个好处是可以让模型在推理时选择最匹配的那个候选词,而不局限于训练数据中出现过的候选词。但同时也增加了一定的难度,模型需要理解不同的词在表达同一个意思。但随着训练,模型可以逐渐学会こ这一点。

标签:logit,prompt,learning,候选词,损失,计算
From: https://www.cnblogs.com/douzujun/p/17380186.html

相关文章

  • ChatGPT-Prompts使用指南
    1.StandardPromptsStandardpromptscanbecombinedwithothertechniqueslikerolepromptingandseed-wordpromptingtoenhancetheoutputofChatGPT.......
  • 论文解读(ID-MixGCL)《ID-MixGCL: Identity Mixup for Graph Contrastive Learning》
    论文信息论文标题:ID-MixGCL:IdentityMixupforGraphContrastiveLearning论文作者:GehangZhang.....论文来源:2023aRxiv论文地址:download 论文代码:download视屏讲解:click介绍    ......
  • Heuristic-Guided Reinforcement Learning
    发表时间:2021(NeurIPS2021)文章要点:这篇文章提出了一个Heuristic-GuidedReinforcementLearning(HuRL)的框架,用domainknowledge或者offlinedata构建heuristic,将问题变成一个shorter-horizon的子问题,从而更容易解决。具体的,就是将原始的MDP变换成一个新的reward和gamma的M......
  • Medicine River ————-Learning journals 9
    Deardairy.                                20206MayHey,Harlan,longtimenosee.Howhaveyoubeenlately?I'vebeenquitebusylately.Ihopeyoudon'tblamemefornotcomingtoseeyo......
  • ChatGPT最全提示词Prompts总结,看这一篇就够了!
    以下几乎涵盖了各类人群想要使用ChatGPT的所有提示词,需要的朋友可以直接复制粘贴使用。从翻译到整理耗费超过2个小时,如果内容对大家有帮助,请不要吝啬你们的喜欢、点赞、关注~​如何正确的提问?担任创业技术律师我将要求您准备一页纸的设计合作伙伴协议草案,该协议是一家拥有I......
  • 《花雕学AI》31:ChatGPT--用关键词/咒语/提示词Prompt激发AI绘画的无限创意!
    你有没有想过用AI来画画?ChatGPT是一款基于GPT-3的聊天模式的AI绘画工具,它可以根据你输入的关键词/咒语/提示词Prompt来生成不同风格和主题的画作。Prompt是一些简短的文字,可以用来指导ChatGPT的创作过程。在这篇文章中,我将展示一些用ChatGPT和不同的Prompt创造出来的有趣和创意的A......
  • Robust Deep Reinforcement Learning against Adversarial Perturbations on State Ob
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!NeurIPS2020 ......
  • Learning A Single Network for Scale-Arbitrary Super-Resolution
    LearningASingleNetworkforScale-ArbitrarySuper-Resolutionabstract现有的singleimageSR网络是为具有特定整数比例因子(例如,×2/3/4)的图像开发的,无法处理非整数和非对称SR。在本文中,作者建议从特定比例的网络中学习任意比例的图像SR网络。introduction由于上采样......
  • 从代码上解析Meta-learning
    文章目录1.背景2.Meta-learning理解2.1Meta-learning到底做什么2.2MAML算法2.3MAML算法步骤2.4MAML代码分析和实现3.参考文章1.背景meta-learning区别于pretraining,它主要通过多个task来学习不同任务之间的内在联系,通俗点说,也即是通过多个任务来学习共同的参数。举个例子,人类在......
  • iOS MachineLearning 系列(10)—— 自然语言分析之文本拆解
    iOSMachineLearning系列(10)——自然语言分析之文本拆解本系列的前几篇文章介绍了iOS中有关图像和视频处理的API,视觉处理主要有Vision框架负责,本篇起,将介绍在iOS中MachineLearning领域相关的自然语言处理框架:NaturalLanguage。1-简介NaturalLanguage是iOS种提供的一种处理自......