首页 > 其他分享 >一文读懂生成式人工智能的所有基础知识(上)

一文读懂生成式人工智能的所有基础知识(上)

时间:2023-12-08 19:13:04浏览次数:25  
标签:人工智能 模型 生成式 基础知识 读懂 内容 判别式 生成

生成式人工智能已经成为一项突破性技术,改变了我们的生活与工作方式。

它不仅是一种技术现象,更是一种广泛应用于实际生活的工具。

2023 年,世界见证了生成式人工智能的多项突破,其中最引人注目的当属由 OpenAI 开发的最新版本ChatGPT。该工具于2022年11月向公众发布测试,短短五天内就有超过100万人注册使用,至今热度不减。

可以说,生成式人工智能对人工智能世界的影响是深远的,我们才刚刚开始触及其潜力的表层。

在本文中,我们将介绍生成式人工智能的所有基础知识并概述其当前的生态系统。

什么是生成式人工智能?

生成式人工智能又名AIGC,是相对于PCG(专业生成内容)、UCG(用户生成内容)提出的又一概念。它善于从现有内容中学到的模式来创建新内容,包括文本、图像、音频、视频和3D交互内容等各种形式的内容和数据。

中国信息通信研究院曾在《人工智能生成内容(AIGC)白皮书(2022年)》中发表观点,将AIGC的发展历程大致分为三个阶段,分别为早起萌芽阶段(1950-1990)、沉淀积累阶段(1990-2010)与快速发展阶段(2010-至今)。

其中,快速发展阶段是AIGC的新时代。自14年起,随着以生成式对抗网络(Generative Adversarial Network,GAN)为代表的深度学习算法的提出与迭代更新,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。

  • 2017 年,微软人工智能少女“小冰”推出了世界首部 100%由人工智能创作的诗集《阳光失了玻璃窗》。
  • 2018年,英伟达发布的 StyleGAN模型可以自动生成图片,目前已升级到第四代模型 StyleGAN-XL,其生成的高分辨率图片人眼难以分辨真假。
  • 2019 年,DeepMind 发布了DVD-GAN模型用以生成连续视频,在草地、广场等明确场景下表现突出。
  • 2021 年,OpenAI 推出了DALL-E并于一年后推出了升级版本 DALL-E-2,主要应用于文本与图像的交互生成内容,用户只需输入简短的描述性文字,DALL-E-2 即可创作出相应极高质量的卡通、写实、抽象等风格的绘画作品。
  • 2022年,OpenAI推出了聊天机器人ChatGPT(基于GPT-架构的大型语言模型)。ChatGPT除了可以以文字方式与用户进行互动,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答等功能,还具有编写和调试计算机程序,创作文本、故事的能力。
  • 2023年,百度推出了全新一代知识增强大语言模型文心一言(文心大模型4.0)。自全面开放以来,用户数量已达7000万,应用场景扩展到4300个,无论是帮助列提纲、写邮件、写调研报告、做会议纪要,还是为工程师推荐和生成代码,文心一言都展现出了卓越的性能和实用性。

生成式与判别式模型(GM&DM)

从内容层面讲,生成式人工智能之所以被称为生成式,是因为它创造了以前不存在的东西,而判别式仅限区分类型的不同。

举个例子,判别人工智能试图回答这样的问题:“这张图片是A还是B的图画?” 而生成式人工智能则对诸如“给我画一张A与B坐在一起的图片”之类的提示做出反应。

而从技术角度剖析,生成式模型是针对联合分布进行建模,判别式模型是针对条件分布建模。判别式模型更注重对于分类任务的解决,生成式模型则更专注于对于数据的理解和建模。

所以,在区分一个物种是A还是B类型的问题时,两种模型的工作思路分别如下:

  • 判别式模型:从过往数据中学习到模型,并通过提取该物种特征来预测其为A或B的概率。
  • 生成式模型:先利用vA的特征习得一个A的模型,再根据B的特征习得一个B的模型。然后从该物种中提取特征,分别放入A模型与B模型,比较概率大小,较大的那个即为答案。

此外,需要注意的是,判别式模型对数据的要求较低,只需要有足够的标记数据即可进行学习,而生成式模型则需要更多的无标记数据来进行模型的学习。

在一些既定类型区分或选择的场景下,判别式模型具有更高的准确性,效率更高,而在需要生成新样本或数据重建的场景下,生成式模型往往优势更大。

未完待续......

 

标签:人工智能,模型,生成式,基础知识,读懂,内容,判别式,生成
From: https://www.cnblogs.com/manfukeji/p/17888850.html

相关文章

  • 13、QT窗口API函数基础知识
    QT窗口API函数geometry()用于获取窗口在屏幕上的几何位置和大小QRectgeo=widget->geometry();intx=geo.x();//窗口左上角的x坐标inty=geo.y();//窗口左上角的y坐标intw=geo.width();//窗口的宽度inth=geo.height();//窗口的高度width()函数返......
  • 静态HTTP的基础知识:菜鸟的教程与指南
    大家好,今天我要给大家讲解一个非常基础但重要的知识点——静态HTTP。如果你是一位初入互联网的小白,对于HTTP这个缩写可能还有些陌生。没关系,今天我们就来揭开它的神秘面纱。首先,让我们想象一下,当你在浏览器中输入一个网址,比如www.example.com,你的浏览器就开始和这个网站的服务器进......
  • Java语言基础知识全总结
    一.Java的优点1.      跨平台性。一次编译,到处运行。Java编译器会将Java代码编译成能在JVM上直接运行的字节码文件,C++会将源代码编译成可执行的二进制代码文件,所以C++执行速度快2.      纯面向对象。Java所有的代码都必须在类中书写。C++兼具面向对象和面向过程的特......
  • 一文读懂〖MVCC〗多版本并发控制
    MVCC即多版本并发控制(Multi-VersionConcurrencyControl),是一种用于数据库管理系统的技术,主要用于提高数据库系统在并发操作下的性能,同时保证事务的一致性和隔离性。其核心思想是为每个读取的数据库对象(如行或记录)提供其事务时间点的快照,而不是锁定数据以防止其他事务访问。一、MVC......
  • uml基础知识
    Uml常用的9种图可以分为静态图和动态图两种,其中常用的静态图5种,动态图4种,静态图:用例图,类图,包图,对象图,部署图动态图:顺序图,通信图,状态机图,活动图。类图(ClassDiagram)类图是UML中最常用的图之一,用于描述系统中类的结构。它展示了类之间的关系,包括继承、聚合、关联等。类图还可......
  • UML各类基础知识总结
    1、UML关系泛化(也就是我们传统意义上的继承关系)子类继承父类,关系用extend关键字标识;关联可以说是一种属于关系,图中即说的是PhoneNumber类属于Master类,同时,除了一对一的关系之外,还可以用一对多、多对一、多对多的关联关系,除了单向关联之外,双向关联也是存在的;需要注意的是,在......
  • UML基础知识总结
    UML(UnifiedModelingLanguage)统一建模语言,又称标准建模语言。是用来对软件密集系统进行可视化建模的一种语言。UML的定义包括UML语义和UML表示法两个元素。UML是在开发阶段,说明、可视化、构建和书写一个面向对象软件密集系统的制品的开放方法。最佳的应用是工程实践,对大规模,复杂......
  • Python基础知识——变量
    Python基础知识——变量2.2变量message="HelloPythonworld"print(message)message="HelloPythonCrashCourseworld!"print(message)mesage="HelloPythonCrashCoursereader"print(mesage)每个变量(variable)指向一个值(value)python始终记......
  • UML基础知识
    什么是UML?UML(UnifiedModelingLanguage),即统一建模语言,是一种为面向对象系统的产品进行说明、可视化和编制文档的一种标准语言,是非专利的第三代建模和规约语言。UML是面向对象设计的建模工具,独立于任何具体程序设计语言。在结构化开发方法中,系统分析的建模语言是数据流图,系统设......
  • UML各类基础知识总结
    1、UML关系泛化(也就是我们传统意义上的继承关系)子类继承父类,关系用extend关键字标识;关联可以说是一种属于关系,图中即说的是PhoneNumber类属于Master类,同时,除了一对一的关系之外,还可以用一对多、多对一、多对多的关联关系,除了单向关联之外,双向关联也是存在的;需要注意的是,在......