首页 > 其他分享 >chatGPT发展中Few-Shot, Zero-Shot & One-shot 的通俗理解

chatGPT发展中Few-Shot, Zero-Shot & One-shot 的通俗理解

时间:2023-10-23 19:56:52浏览次数:55  
标签:Shot few zero Few Zero GPT shot chatGPT

先解释 one-shot。公司门禁用了人脸识别,你只提供一张照片,门禁就能认识各个角度的你,这就是 one-shot。可以把 one-shot 理解为用 1 条数据 finetune 模型。在人脸识别场景里,one-shot 很常见。

zero-shot 与 few-shot,回到 NLP 场景。用 wikipedia、新闻等,训练一个 GPT 模型,直接拿来做对话任务,这个就是 zero-shot。然后,发现胡说八道有点多,找了一些人标注了少量优质数据喂进去,这就是 few-shot

chatGPT 的发展史,就是从 zero-shot 到 few-shot。(摘自沐神的 paper reading 系列)

背景。GPT-3 之前,跟 Bert 是两条路线的竞争关系。
GPT-2 是 zero-shot。效果没有超过 bert,又想发 paper,就把自己的卖点定义为 zero-shot(方法创新),即完全的无监督学习,论文的题目:Language Models are Unsupervised Multitask Learners。
GPT-3 是 few-shot。效果比 bert 好,不用找学术方法的卖点了,而且,zero-shot 做产品的性价比确实不高,换成了 few-shot,也就是找了一些人做标注。论文的题目:Language Models are Few-Shot Learners。
chatGPT 是 HFRL。GPT-3 之后的问题是:few-shot 时到底 shot 啥(标注哪些数据)?他们跟强化学习结合起来,也就是 human feedback reenforcement learning,俗称 HFRL。也就是 chatGPT 的核心技术。

HRFL 这套方法,本质目的是:如何把机器的知识与人的知识对齐。然后开创了一个新的方向,叫 alignment。openAI 在内的好多大佬,都在追这个新方向。
注:这里的 alignment,与人脸识别里的 alignment,完全不一样。

参考链接:https://zhuanlan.zhihu.com/p/624793654

标签:Shot,few,zero,Few,Zero,GPT,shot,chatGPT
From: https://www.cnblogs.com/edkong/p/17783314.html

相关文章

  • 论文阅读:Few-Shot Point Cloud Semantic Segmentation via Contrastive Self-Supervis
    Few-ShotPointCloudSemanticSegmentationvia ContrastiveSelf-SupervisionandMulti-ResolutionAttention基于对比自我监督和多分辨率注意力的小样本点云语义分割摘要本文提出了一种适用于现实世界应用的有效的小样本点云语义分割方法。现有的点云小样本分割方法在很大程......
  • ArthasHotSwap插件使用
    ArthasHotSwap插件使用1、安装插件2、指定服务器上需要热部署的java进程因为服务器上可能不止一个java进程,如果不指定进程,热更会新默认更新第一个3、反编译字节码运行arthasjava-jararthas-boot.jar选择java进程查看正在使用的类jadcom.ruoyi.race.service.impl......
  • GraalVM进行spring boot的native编译报错 “returned non-zero result”解决方法
    使用GraalVM对springboot工程进行native编译:系统:CentosJDK:GraalVMJDK21报错:Ifyouareunabletoresolvethisproblem,pleasefileanissuewiththeerrorreportat:https://graalvm.org/support[INFO]---------------------------------------------------------......
  • Internet-augmented language models through few-shot prompting for open-domain qu
    Internet-augmentedlanguagemodelsthroughfew-shotpromptingforopen-domainquestionanswering 其实我没怎么正经读过论文,尤其是带实验的,我目前认真读过的(大部头)也就是一些LLM的综述。记录这个文档主要是防止自己读着读着玩手机去了/注意力不集中了跑路了/没记录困惑导......
  • Codeforces Round 896 (Div. 2) A. Make It Zero
    给一个大小为\(n\)的数组\(a\)\((n\geq2)\)。你希望进过一些操作使得\(\foralli,a_i=0\)。在一步操作中,可以选择\(1\leql\leqr\leqn\)并且执行:\(s=\bigoplus_{i=l}^{r}a_i\)。\(\foralll\leqi\leqr,a_i=s\)。输出一个解决方案,使得操作......
  • 论文精读:用于少样本图像识别的语义提示(Semantic Prompt for Few-Shot Image Recogniti
    原文连接:SemanticPromptforFew-ShotImageRecognitionAbstract在小样本学习中(Few-shotLearning,FSL)中,有通过利用额外的语义信息,如类名的文本Embedding,通过将语义原型与视觉原型相结合来解决样本稀少的问题。但这种方法可能会遇到稀有样本中学到噪声特征导致收益有限。在这......
  • Test class should have exactly one public zero-argument constructor(测试类应该只
    在练习重写equals方法时写测试方法遇到这个问题先放报错代码:publicclassOrder{intorderId;StringorderName;publicintgetOrderId(){returnorderId;}publicvoidsetOrderId(intorderId){this.orderId=orderId;}......
  • Codeforces Global Round 11 A. Avoiding Zero
    给一个大小为\(n\)的数组\(a_1,a_2,\cdots,a_n\)。你需要构造一个大小为\(n\)的数组\(b\)且满足以下条件:数组\(b\)是数组\(a\)的冲排列对于\(\forallk=1,2,\cdots,n\),\(\sum_{i=1}^{k}b_i\neq0\)。输出任意一组构造,或者回答不可能。若\(\sum_{i......
  • 微服务框架之go-zero
    官方文档:  https://go-zero.dev/ [安装]脚手架goctl:goinstallgithub.com/zeromicro/go-zero/tools/goctl@latest 依赖protoc,protoc-gen-go,protoc-grpc-go安装:protoc:下载:https://github.com/protocolbuffers/protobuf/releases/download/v21.11/protoc-21......
  • P7782 「MCOI-Zero / AC6-M03」 Sipli Field
    P7782「MCOI-Zero/AC6-M03」SipliField更好的阅读体验单log淀粉做法。回想正常淀粉计算的是树上的路径问题,但题目中要求计算经过每个点的答案,这样我们选取重心后一棵子树对另一棵子树的答案就会少算,所以我们淀粉时不仅要算根的答案,也要考虑子树间的相互贡献。首先以根......