首页 > 其他分享 >OpenAI是什么

OpenAI是什么

时间:2023-02-25 14:00:32浏览次数:53  
标签:人工智能 什么 学习 任务 OpenAI GPT 模型


 OpenAI是一家非营利性人工智能研究公司,致力于研究人工智能和其他机器学习技术。OpenAI 会和谷歌、苹果、IBM 等知名公司创办的其它一系列项目一道探索先进计算机技术,解决面部识别或语言翻译等问题。

​OpenAI​​ 是由马斯克、奥特曼等人 2015 年联合创办的​​人工智能​​研究机构,后来马斯克推出,微软以投资 10 亿美元。OpenAI 首先推出千亿级参数的大模型 GP-3,被认为是谷歌旗下人工智能公司 DeepMind 的竞争对手。OpenAI 会和谷歌、苹果、IBM 等知名公司创办的其它一系列项目一道探索先进计算机技术,解决面部识别或语言翻译等问题。2015 年 12 月 12 日,非盈利性的人工智能项目 OpenAI 宣布正式启动。​​免费体验OpenAI​

OpenAI是什么_生成模型


OpenAI 是一个人工智能研究实验室,由营利组织 OpenAI LP 与母公司非营利组织 OpenAI Inc 所组成,目的是促进和发展友好的人工智能,使人类整体受益。OpenAI 成立于 2015 年底,总部位于旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。

2019 年 3 月 1 日成立 OpenAI LP 子公司,目的为营利所用。2019 年 7 月 22 日微软投资 OpenAI 10 亿美元,双方将携手合作替 Azure 云端平台服务开发人工智能技术。2020 年 6 月 11 日宣布了 GPT-3 ​​语言模型​​,微软于 2020 年 9 月 22 日取得独家授权。

2020 年 5 月,Open AI 发表了一篇开创性的论文,题为 Language Models Are Few-Shot Learners。 他们展示了 GPT-3 语言模型,它使用了一个具有 1750 亿个参数的神经网络。 GPT-3 使用来自 CommonCrawl、WebText、维基百科和书籍语料库的数据进行训练, 并在各种自然语言处理任务中表现出惊人的性能,包括翻译、问答和完形填空任务。在性能上 GPT-3 也是非常优秀, 超过了很多现有的模型。2020 年 7 月,也就是论文发表两个月后,OpenAI 开放了一个 beta API playground,大家可以通过 API 方式访问 GPT-3 模型。

GPT-3 的几个主要特点

1. 零/单/少样本学习(Zero/one/few-shot learning): 通常,深度学习会针对一组特定的类别进行训练和测试。 如果计算机视觉中对星球大战中的 BB8 , R2D2 , C3PO 进行分类,在测试过程中就只能针对这三个类别进行。 但在零样本学习设置中,系统在测试时,可以使用不在训练内的类别(例如,用曼努达人做测试)。 单/少样本学习(one-shot 和 few-shot) 也是一个道理,在测试时,系统会分别看到一个或几个新的类别。

2. 零/单/少样本任务迁移(Zero/one/few-shot task transfer): 这个整合了 零/单/少样本学习和多任务学习的概念。 新任务(或者显示零个、一个或几个新任务的示例)可以随时执行,而不是在测试时才展示新类。 例如, 输入 “I love you -> 我爱你。 I miss you -> ____。” GPT-3 就可以通过单样本任务迁移 ,把之前没有训练过的英语转中文的任务执行起来

3. Transformers: Transformers 是解决机器翻译问题的框架, 有一个简单的网络结构,基于自注意机制,不依赖于递归和卷积完全。通过并行计算使 Transformer 效率高,需要更少的训练时间。

4. 生成模型(Generative models): 统计学中分类任务有两种模型-判别模型,生成模型。 判别模型对给定的可观察变量和目标变量对的条件概率进行编码:p(y|x)。 生成模型对联合概率进行编码:p(x,y)。 生成模型可以“生成类似于现有数据的新数据”,GPT-3 模型就是应用生成模型来。

5. 多任务学习(Multitask learning): 大多数深度学习系统都是单任务的, 只针对特定的场景。多任务系统克服了这一限制。 他们受过训练,能够针对给定的输入解决不同的任务。 例如我输入一个苹果,他可以帮我翻译成英文的 Apple ,可以找到一张苹果的图片,也可以找到苹果的一些特征等。

6. 半监督学习(Semi-supervised learning): 是以无监督的方式训练具有非常大数据集的模型,然后通过在较小的数据集中使用监督训练来调整模型以适应不同的任务。

由于微软现在还没开放 OpenAI 的 GPT-3 功能 , 现阶段我们只能通过 OpenAI (beta.openai.com) 提供的 API 使用 GPT-3 。(当然你需要有一个美国的电话号码来激活该功能) ,OpenAI 有非常丰富的文档, 以及示例 ,让开发者可以非常快上手使用 API。

GPT-3 功能强大 ,让 AI 应用场景更贴近实际的生活 。 我非常希望微软的 OpenAI Service 能尽快开放 ,让更多的开发者能使用。 还有现在 OpenAI GPT-3 在中文的支持还是非常有限的, 我也寄望微软版本的服务能有更好的中文支持。

 


标签:人工智能,什么,学习,任务,OpenAI,GPT,模型
From: https://blog.51cto.com/u_15964265/6085446

相关文章

  • L9_用日语询问某个东西是什么
    动画会话A:ここが「デパ地か」だよ。这里就是百货商店的地下食品区。B:いろんな食べ物があって、いいよね。有各种吃的,真好。C:わあ、すごい。これは何なんですか。......
  • Java处理前端日期控制器传过来的开始时间和结束时间;程序、进程、线程、多线程是什么,为
    Java处理前端日期控制器传过来的开始时间和结束时间处理前端日期控制器传过来的开始时间和结束时间\这里其实前端可以处理的当然后台也是可以处理的总体用的方法就是JS......
  • python命令行里\什么意思?
    代表一行没写完接着写的意思,否则按回车就直接执行了。比如运行monodepth2的时候写成这样:pythontrain.py--model_namestereo_model\--frame_ids0--use_stereo--spli......
  • binlog能做什么
    Binlog是MySQL数据库中用于记录数据库操作的日志文件,可以用于实现数据库的数据备份、数据恢复、数据复制等功能。具体来说,Binlog可以用于以下方面:数据备份:Binlog可以记......
  • 一图揭秘为什么开发者都偏好华为云CodeArts IDE Online?
    华为云开发者桌面服务CodeArtsIDEOnline,提供了可随时随地编码的云上开发环境,同时具备开放的生态和独立插件市场,旨在为开发者提供环境快速获取、功能开箱即用、跨越计算架......
  • c语言以及高级语言中的float到底是什么以及IEEE754
    对内存里float4字节的好奇初学计算机都要学那个什么二进制十进制什么补码反码那些玩意儿哈,由于最近要做一个单片机往另外一个单片机发数据的需求,直接c语言指针然后float......
  • 用chatgpt写代码是什么体验
    leetCode刷题,二叉树层序遍历用js实现,找答案,发现代码没注释,看不懂,就试着找当下很流行的chatpgt帮忙写下,没想到chatpgt非常强大,看下图:1.先让他解题。解答的很详细,构造树方......
  • 什么是操作系统
    特点:没有一个完整、精确、公认的定义,我们可以操你个功能和特点来介绍操作系统。功能:操作系统是一个管理应用的程序,控制系统上程序的运行为程序提供各种各样的程序,使得......
  • EasyCVR智能边缘网关双网卡连接路由器报跨域错误是什么原因?
    EasyCVR智能边缘网关是TSINGSEE青犀视频软硬一体的一款产品,可提供多协议的设备接入、采集、AI智能检测与识别、处理、分发等服务,能实现海量前端设备的接入/转码/分发、视频......
  • 推荐使用什么样的平台表单制作工具好?
    在办公自动化迅猛发展的今天,传统的表单制作工具已经不能满足各行各业的生产需求,引用专业的低代码开发平台表单制作工具可以助力企业提高作业协作效率。那么,什么平台的表单......