首页 > 其他分享 >OpenAI公布GPT-4:可在考试中超过90%的人类

OpenAI公布GPT-4:可在考试中超过90%的人类

时间:2023-06-23 20:04:54浏览次数:31  
标签:模型 90% 3.5 OpenAI 测试 人类 GPT




OpenAI公布GPT-4:可在考试中超过90%的人类_自然语言处理


当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4.该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

,时长24:27


OpenAI GPT-4官方演示视频

OpenAI表示,我们已经创建了GPT-4,这是OpenAI在深度学习规模化方面的最新里程碑。GPT-4是一个大型的多模型模型(接受图像和文本输入、输出文本),虽然在许多现实场景中不如人类聪明,但在各种专业和学术基准测试中表现出人类水平的性能。


OpenAI公布GPT-4:可在考试中超过90%的人类_神经网络_02


看起来,现在的 GPT 已经不会在计算上胡言乱语了:


OpenAI公布GPT-4:可在考试中超过90%的人类_自然语言处理_03


还是个物理题:


OpenAI公布GPT-4:可在考试中超过90%的人类_Powered by 金山文档_04


GPT-4 看懂了法语题目,并完整解答:


OpenAI公布GPT-4:可在考试中超过90%的人类_Powered by 金山文档_05


GPT-4 可以理解一张照片里「有什么不对劲的地方」:



  OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这两款产品极大地吸引了公众的关注,并刺激其他科技公司更积极地追求人工智能(AI)。


OpenAI公布GPT-4:可在考试中超过90%的人类_深度学习_06


  OpenAI周二表示,在内部评估中,相较于GPT-3.5,GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。


OpenAI公布GPT-4:可在考试中超过90%的人类_神经网络_07


  OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

  例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

GPT-4更可靠、更有创造力,能够处理更微妙的指令。


OpenAI公布GPT-4:可在考试中超过90%的人类_深度学习_08


GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

  OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。

  OpenAI合作伙伴微软周二表示,新版必应搜索引擎将使用GPT-4。

标签:模型,90%,3.5,OpenAI,测试,人类,GPT
From: https://blog.51cto.com/u_13046751/6538929

相关文章

  • AI文案撰写客户端 OpenAI ChatGPT v0.11.0
    本文转载自:AI文案撰写客户端OpenAIChatGPTv0.11.0更多内容请访问钻芒博客:https://www.zuanmang.net软件介绍ChatGPTv0.11.0是一款由 OpenAI 官方开发出品的深度学习技术的人工智能聊天机器人软件,它通过大量的语言训练,可以回答各种问题,如科技、历史、地理、数学等,并能生......
  • 不用RLHF,匹敌GPT-4!Meta重磅发布LIMA 65B,1000个样本性能飞升,LeCun转赞
    人人都知,让ChatGPT称霸天下的秘密武器,就是人类反馈强化学习(RLHF)。而现在,MetaAI等机构的爆火研究LIMA直接打破这一规则,直言RLHF并没有那么重要!论文一出,直接在AI圈炸了锅!就连LeCun忍不住发推炫一番:LIMA:LLaMa-65B+1000监督样本=GPT-4/Bard级别的性能。正如标题所称,LIMA是「LessisMo......
  • Python播放GIF图片(ChatGPT代码参考)
    在网上找了好几个方法,最后还是出现各种问题,解决不了播放GIF的功能。最后,通过ChatGPT给出了简单明了的方案(使用第三方库imageio和matplotlib.animation来实现),调试直接通过。但有小瑕疵,就是显示gif时隐藏掉坐标轴的功能无效,于是再做了一下优化。 [最终代码]显示GIF动画:imp......
  • 如何使用 40 个 ChatGPT 插件包括搜索网络
    OpenAI提供了超过540个ChatGPT插件,其中近20%搜索网络。了解这些AI驱动的搜索工具的工作原理以及哪些工具最好。随着最近ChatGPT插件商店的扩展,不断发展的人工智能格局又向前迈进了一大步。该商店以提供大量增强ChatGPT功能的插件而闻名,现在拥有近550个插件的令人印象深刻的......
  • ChatGPT和AI会重燃中国的虚拟宇宙吗?
    随着像Meta这样的科技巨头关闭他们的元宇宙部门以支持人工智能(AI)的努力——尽管他们认为元宇宙仍将是其主要产品——观众们相信,以前备受赞誉的虚拟生态系统已经被AI淘金热从互联网宝座上推倒了。人工智能的利润潜力在今年上半年吸引了一大批投资者和采用者。OpenAI的ChatGPT......
  • MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT
    MosaicML正在推出其第二个开源大型语言模型(LLM),称为MPT-30B,这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义,我采访了MosaicML联合创始人兼首席执行官NaveenRao。他之前的创业公司是Nervana,这是一家深度学习公司,于2016年被英特尔收购,所以他最近......
  • GPT-4老板:AI可能会杀死人类,已经出现我们无法解释的推理能力
    “AI确实可能杀死人类。”这话并非危言耸听,而是OpenAICEO奥特曼的最新观点。而这番观点,是奥特曼在与MIT研究科学家LexFridman长达2小时的对话中透露。不仅如此,奥特曼谈及了近期围绕ChatGPT产生的诸多问题,坦承就连OpenAI团队,也根本没搞懂它是如何“进化”的:从ChatGPT开始,AI出现了......
  • ChatGPT背后的指令学习是什么?PSU最新首篇《指令学习》技术全面综述,详述指令学习关键问
    任务语义可以用一组输入到输出的例子或一条文本指令来表示。传统的自然语言处理(NLP)机器学习方法主要依赖于大规模特定任务样本集的可用性。出现了两个问题: 首先,收集特定于任务的标记示例,不适用于任务可能太复杂或太昂贵而无法注释,或系统需要立即处理新任务的场景;其次,这对用户......
  • 独家专访:OpenAI 的 Sam Altman 谈 ChatGPT 以及通用人工智能如何“打破资本主义”
    作为OpenAI的首席执行官,SamAltman领导的这家初创公司是正在快速增长的生成式AI行业中最热门且最受关注的一家。在1月中旬参观了OpenAI的旧金山办事处后,福布斯采访了这位最近不太愿意在媒体上抛头露面的投资者和企业家,讨论了ChatGPT、通用人工智能、以及该公司的人工智能......
  • MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT
    MosaicML正在推出其第二个开源大型语言模型(LLM),称为MPT-30B,这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义,我采访了MosaicML联合创始人兼首席执行官NaveenRao。他之前的创业公司是Nervana,这是一家深度学习公司,于2016年被英特尔收购,所以他最近......