首页 > 其他分享 >AI热点概念解读:一文搞懂这些热词

AI热点概念解读:一文搞懂这些热词

时间:2024-02-06 10:23:47浏览次数:39  
标签:令牌 AI 热词 OpenAI LLM GPT 搞懂 ChatGPT

自 ChatGPT 问世以来,AI的风口就来了。

AI是一门研究如何使计算机具有类似人类智能的学科。

自从ChatGPT-3.5给大家带来了极大的震惊之后,全民都在谈论AI,在这个AI大时代背景之下,如果你想进一步了解AI相关热词含义,从而更好的理解当下AI的基础原理,本文就不容错过。

如今,当你找专业人士解释一些关于AI的基础概念,最大的问题就是,你也许只是想简单的了解一个热词的简单解释,回答者跟你解释时,却引入了更多你不熟悉的新概念。

当你不得不追问这些新概念的含义时,却发现又引入了一堆新词,此刻是不是感觉头都大了?其实这么多新词和概念也很难通过一次简短的询问来搞懂并厘清期间的关系。

如果你也有这样的困惑,无论是提问方还是解答方,都可以利用这篇文章来帮助自己理解或辅助回答。

下面我们就从最熟悉的ChatGPT切入提问,看看都有哪些AI相关高频词汇,又各自是什么意思。

ChatGPT 是什么?

ChatGPT是一种LLM(大语言模型),具体是由OpenAI开发的一种聊天型生成预训练模型。它基于GPT架构,专门设计用于处理自然语言对话和生成有意义的回应。

LLM(大语言模型)是什么?

LLM英文全称是:Large Language Model。

大语言模型通常是指参数规模庞大、在大规模语料库上进行训练的自然语言处理模型。

另外LLM也不止OpenAI的GPT一种,还有其他很多家,比如Meta的Llama 2,以及更专注于企业应用的Cohere等。

OpenAI 是什么?

OpenAI是一个人工智能研究实验室,致力于推动人工智能的发展。

OpenAI 是许多先进语言模型的背后力量,其中最著名的就是 GPT 系列。

GPT 是什么?

GPT 全称是 "Generative Pre-trained Transformer",翻译成中文是"生成式预训练转换器"。

GPT 是 OpenAI 提出的一系列预训练语言模型,它采用了 Transformer 架构。这些模型在大规模文本数据上进行预训练,学习了丰富的语言知识,可以用于各种自然语言处理任务。

Transformer 是什么?

Transformer 是一种深度学习架构,被广泛用于处理序列数据,比如自然语言处理(NLP)。

它的自注意力机制使其在处理长距离依赖和捕捉序列中的上下文关系方面非常强大。

GPT 就是基于 Transformer 架构构建的。Transformer 架构的主要组成部分包括编码器(Encoder)和解码器(Decoder)。

Encoder 和 Decoder 怎么理解?

编码器(Encoder)负责将输入序列映射为高维度的向量表示。

解码器(Decoder)用于生成目标序列。

向量(Vector)又是什么?

为了让计算机理解和处理文本,我们需要将离散的令牌转换为连续的表示形式。这时,就引入了向量的概念。

向量是一种包含数值的数组,它能够表示令牌的语义信息。每个维度都承载着特定的语义或信息,使得计算机能够更好地理解文本。

令牌(Token)又是个啥?

在自然语言处理中,我们将文本划分为基本单元,这些基本单元称为令牌。

令牌可以是单词、字符或其他离散的文本单位。在处理文本数据时,我们通常将它们作为模型的输入。

每个令牌代表着文本的一个部分,是构建语言模型的基础。

那令牌如何能够向量化呢?

为了将离散的令牌映射到连续的向量表示,我们使用了嵌入技术。

嵌入(Embedding)是一种将高维度、离散的数据映射到低维度、连续空间的方法。

在自然语言处理中,词嵌入(Word Embedding)是常见的嵌入技术,它将单词映射为密集的向量,捕捉了单词之间的语义关系。

向量化数据存在哪里?

向量化数据建议存储在数据库中,这样能够允许高效的检索和查询。

向量可以作为数据库中的一个字段进行存储,或者存储在专门设计的向量数据库中。

企业AI应用中被高频提到的RAG是个啥?

RAG 全称是 "Retrieval-Augmented Generation",表示一种检索增强生成的方法。

听完这样的解释是不是更懵了?咋就增强了?

好吧,说人话,RAG 模型就是结合了上面我们提过的LLM 和 外部知识库,以实现生成过程的增强和优化。

啥叫外部知识库?为啥如此强大的LLM要结合外部知识库呢?

外部知识库就是LLM在训练过程中未直接学习到的、特定领域或任务的额外信息。

比如企业自己的私域知识,例如某保险公司新推出的一些具体保险产品详情,通用LLM训练时肯定就不可能有这样的知识。

又比如一些特定领域的专业知识,诸如医学数据库、法律文件、科学论文等,通用LLM训练时未完全涵盖或深入理解这些领域。

通过结合这样的外部知识库,RAG 模型能够在生成过程中利用这些额外的知识和上下文,使其在特定企业AI应用中能够更为灵活和强大。

最后,大家觉得ChatGPT到底有没有自己的思想?

笔者认为在理解上述基本原理概念之后,会发现在这个机制下,尽管ChatGPT可以生成看起来像是回应问题或进行对话的文本,让人误以为它有思想,但它其实并不具备深层次的理解、意识或主观性。

不过这也是基于当前的ChatGPT,随着AI技术不断发展未来还真不好说,之前不是就因为担忧AI未来的安全问题,还引发了那场OpenAI的CEO被罢免的事件吗,大家怎么看呢?

标签:令牌,AI,热词,OpenAI,LLM,GPT,搞懂,ChatGPT
From: https://www.cnblogs.com/jyzhao/p/18009247/ai-re-dian-gai-nian-jie-du-yi-wen-gao-dong-zhe-x

相关文章

  • 执行truncate时报错:ORA-00054:资源正忙但指定以NOWAIT 方式获取资源或者超时失效,怎样
    在执行TRUNCATE语句时出现错误,可能是由于以下原因之一:表正在被其他会话使用:如果表正在被其他会话使用,您将无法执行TRUNCATE操作。请确保没有其他会话正在使用该表,并尝试再次执行TRUNCATE。权限不足:如果您没有足够的权限来执行TRUNCATE操作,则会收到错误消息。请确保您具有足......
  • P10125 「Daily OI Round 3」Simple 题解
    题目传送门简单模拟,主要考察字符串。首先输入一个char类型的数组,然后直接遍历每一位是否为Acoipp或Svpoll即可。//Simple//codeby:cq_irritater//time:2024/02/04#include<bits/stdc++.h>usingnamespacestd;chara[10];intmain(){//freopen("c......
  • raid 磁盘冗余阵列
    什么是raid磁盘冗余阵列这是由多块独立磁盘(多为硬盘)组合的一个超大容量磁盘组。大白话的解释磁盘冗余阵列,就是将很多块硬盘组合成一个整体,不同的RAID级别,可以实现不同的功能如加速数据读写、如实现数据备份。raid技术的作用-提高IO能力,磁盘并行读写-提高耐用性,磁......
  • Docker:Failed to copy files, no space left on device
    主页个人微信公众号:密码应用技术实战个人博客园首页:https://www.cnblogs.com/informatics/问题描述在Mac上进行docker构建时,偶尔会遇到以下问题Failedtocopyfiles:userspacecopyfailed:write/var/lib/docker/volumes/xxx/_data/xxx.dbf:nospaceleftondevice......
  • Minecraft Fabric模组开发时遇到报错-Failed download after 3 attempts
    MinecraftFabric模组开发时遇到报错-Faileddownloadafter3attempts遇到的主要报错如下(当然以下只是一部分报错)Aproblemoccurredconfiguringrootproject'tuuorial_mod'.Failedtonotifyprojectevaluationlistener.FailedtosetupMinecraft,java.io.Unchecke......
  • containerd 镜像层分析
    meta.db找到d842e8e2623636b8fb0d070a2dd9592c1eb0ebfa975c6a283960bc1f710feab4mediatype:application/vnd.docker.distribution.manifest.v2+json多种类型application/vnd.docker.distribution.manifest.list.v2+json===================================================......
  • R语言LASSO特征选择、决策树CART算法和CHAID算法电商网站购物行为预测分析
    全文链接:http://tecdat.cn/?p=32275原文出处:拓端数据部落公众号本文通过分析电子商务平台的用户购物行为,帮助客户构建了一个基于决策树模型的用户购物行为预测分析模型。该模型可以帮助企业预测用户的购物意愿、购物频率及购买金额等重要指标,为企业制定更有针对性的营销策略提供......
  • 【译】GenAI 的产品:从构建到失败
    原作:褚蓝引言:构建一个酷炫而精美的演示很容易,但构建最终产品则不然。 绝命毒师。2022年秋天,我正在做一个很酷的项目。是的,您猜对了-使用公司特定的数据微调预训练的LLM(Bert)。然而,很快,ChatGPT就发布了,并席卷了全世界。当存在超级强大的LLM时,我尝试微调LLM的意......
  • error: Bind to port 2200 on 0.0.0.0 failed: Permission denied
    这个问题是因为你安装的centos系统中使用了SELinux,下图表示系统启动SELinuxvim/etc/selinux/config esc:wqenter修改sshe端口号vim/etc/ssh/sshd_config重启ssh服务servicesshdrestart 这里再次操作就不会报错了 ......
  • 文件上传错误:Processing of multipart/form-data request failed. Stream ended unexp
    问题描述Processingofmultipart/form-datarequestfailed.Streamendedunexpectedly不通过网关,直接在本地debug是可以上传成功的,线上环境通过网关上传则会导致此错误,可能是网关修改了请求内容。解决方式前端将文件转换为base64字符串,服务端接收到再转换为字节数组......