首页 > 其他分享 >text-davinci-003和ChatGPT是什么关系呢?

text-davinci-003和ChatGPT是什么关系呢?

时间:2023-05-10 15:44:58浏览次数:38  
标签:davinci text 003 GPT ChatGPT chatGPT

 

先看下GPT的发展时间线

InstructGPT(2022 年 1 月)是一系列 GPT-3 模型(包括 text-davinci-001、text-davinci-002 和 text-davinci-003)统称,于GPT-3相比,它的最大不同是针对人类指令(reinforcement learning with human feedback, RLHF)进行了微调 ; InstructGPT 产生的幻觉更少,更真实,但它在生成的多样性或者说创意上相对更差,因为它们试图在“对齐”的前提下,将人类偏好/价值观硬塞进原始数据模型中。

ChatGPT(2022 年 11 月)更进一步。 为了训练 ChatGPT,OpenAI 对 InstructGPT 对话模型进行了微调(马斯克在Twitter上指出openai 使用了Twitter 数据)。 这种微调在一定程度上也是可以的。 区别在于使用的policy and reward model

我们可以先看下 DeepMind 如何构建policy和reward model,然后训练出的 Sparrow 70B取得了和 ChatGPT 相同的结果。下面列出了 DeepMind 用来让聊天机器人符合研究目标的 23 条规则:

http://lifearchitect.ai/sparrow/

OpenAI 也在做同样的事情,他们没有发表论文,但他们博客文章中的图表非常清楚了

也就是说,每次你向 ChatGPT 提出问题或发出提示时,输出只能与类似于上述的规则对齐(除非你找到一些对抗性入口点!)

ChatGPT 的输出更符合人类(这是重点!!!)但不如两年半前(2020 年 5 月)的原始 davinci 有用。感兴趣的朋友可以自己进行比较试试:chat.openai.com (ChatGPT) vs Leta Prompt (davinci classic)

因此,总结一下,两者的主要区别如下:

  1. davinci 比 chatgpt 更开放、更具有创意性;你可以让它做更多种类的事情,但 chatgpt 在其创建的特定任务中“更聪明”——例如创建列表、表格、摘要等
  2. chatGPT也可以认为是 Davinci-3 的衍生产品,它们效果上同样好,但 davinci 使用的训练语料,清洗的程度较chatGPT更少;chatGPT会不断提醒我它的局限性,而 Davinci-003 表现更像人类一样
  3. 如果不添加“让我们逐步思考:”或类似内容,davinci-003 无法正确解决部分问题,而 ChatGPT 更好试用
  4. DaVinci 将更加灵活和通用,但是它要花钱,而且开箱即用效果不佳;DaVinci 的真正目的是与 API 一起使用来开发应用程序;它本身不像 ChatGPT 那样是最终产品。

 

标签:davinci,text,003,GPT,ChatGPT,chatGPT
From: https://www.cnblogs.com/chentiao/p/17388186.html

相关文章

  • spring 2.5 TestContext 测试框架
    大多同事都已经养成用junit写单元测试的习惯,但junit在测试spring时,存在一些不足!1.  Spring容器多次初始化问题根据JUnit测试用例的调用流程,每执行一个测试方法都会重新创建一个测试用例实例并调用其setUp()方法。由于在一般情况下,我们都在setUp()方法中初始化Spring......
  • context sample in golang
    packagemainimport("context""fmt""sync""time")funcroutine(idint,ctxcontext.Context,msgchanint,wg*sync.WaitGroup){deferwg.Done()fmt.Println("routine",id)......
  • spring框架_ApplicationContext实现
    ApplicationContext实现ApplicationContext有四个经典实现ClassPathXmlApplicationContext:经典容器,基于classpath下xml格式的配置文件来创建FileSystemXmlApplicationContext:基于磁盘路径下xml格式的配置文件前两种实现都是用来帮助beanfactory读取bean的都是读取XML......
  • ABAP read_text 使用 快速开始
    DATA : lv_name TYPE thead-tdname.PERFORM frm_read_text USING '0001' lv_name 'RBKP' CHANGING <fs_itab>-zfpdz. *&---------------------------------------------------------------------**& Form frm_read_text*&----------......
  • uniapp 中的 rich-text 富文本 怎样编辑修改 样式
    1.首先在HTML中 <rich-text:nodes="formatRichText(newObjc)"></rich-text>2.在 methods中写入方法formatRichText(html){//html就是你要传进来地富文本参数//去掉img标签里的style、width、height属性......
  • 设置键盘只能输入数字( phoneNumTextField.keyboardType = UIKeyboardTypeNumberPad;)
    //手机号码textFieldphoneNumTextField=[[UITextFieldalloc]initWithFrame:CGRectMake(0,0,[[UIScreenmainScreen]bounds].size.width,40)];UIView*phoneImage=[[UIViewalloc]initWithFrame:CGRectMake(0,0,40,40)];phoneImage.backgroundColor=[U......
  • spring框架_Applicationcontext功能
    Applicationcontext的功能拓展主要来自于不属于beanfactory的接口,主要包括四个接口Messagesource:国际化ResourcePatternResolver:获取资源ApplicationEventPublisher:发布事件EnvironmentCapable:获取环境变量感觉发布事件这个功能有点像消息队列,发布订阅,在compent......
  • Android TextView 设置超链接、关键字高亮等效果
    之前做TextView关键字高亮效果,使用的是Html.fromHtml(Stringsource)方法,然后通过TextView的setText(CharSequencetext)方法来显示后来测试此方法在部分手机上显示有问题,如Nexus4,华为P6等等。于是乎只能继续寻找别的解决办法了,在这里Mark一下。这里用到了SpannableString类......
  • C# 窗体控件ContextMenuStrip下拉项之间的分割线
    1.效果如图: 2.选中ContextMenuStrip控件,在Items属性中添加Separator 3. (其中第3,4步,通过上下箭头,摆置好你要分割的位置)原文链接......
  • 自学c#基础第七课,c#程序打包分发、textBox
    程序打包发布两种方式:1.解决方案右键生成解决方案,生成完成后打开所在路径找到debug文件夹下,压缩下debug所有文件,复制到别的电脑上即可使用。2.新建项目setup类型的,然后一步步设置,然后生成,生成后的文件是一个安装文件,自己复制到别的电脑上运行下,安装自己要的指定目录即可。textB......