学会transformer，只用这一片就够了，学不会来砍我！

时间：2023-02-17 17:11:55浏览次数：46

标签：黑箱 transformer Attention Transformer 就够 Encoder 只用 2022

2022年年底，由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT，以其强大的信息整合和对话能力惊艳全球，两个月内月活用户突破1亿。随着 ChatGPT 的爆火，不禁有人会产生疑问，如此强大的功能是如何实现的？
ChatGPT使用的是 Transformer 算法。OpenAI 通过使用巨大的语料库，使用 Transformer 架构的神经网络对我进行了预训练，使其能够对文本数据进行高效的处理和生成。那么问题来了，Transformer是什么，他是如何运行的，下面请听我娓娓道来。

1.transformer的结构

在了解transformer的结构之前，让我们先举一个例子。翻译软件大家都知道，随便打开一个翻译软件，进行一次英译汉，比如说我输入i love the 2022 Beijing Winter Games那么结果会输出什么呢？

这里我们可以发现，机器成功的翻译出来我们所输入的信息，这里我们所输入的i love the 2022 Beijing Winter Games为输入值，系统输出的为我爱2022年北京冬奥会输出值，我们将软件所进行的不为人知的操作称之为黑箱，因此我们可以将将其分为三部分，输入值，黑箱，输出值，如下图所示。

那么这个黑箱中又是什么呢？其实所谓的“黑箱”，就是Transformer，Transformer的构造很简单，有两大部分构成，由Encoder 和 Decoder，也就是编码器与解码器两大部分构成。

在一般情况下，Encoder和Decoder都分别有6个，因此如下所示

而这里的Encoder，又分为Self-Attention和前馈网络两个部分

Decoder，则在Self-Attention和前馈网络两个部分的基础上，增加了一个encoder-decoder-Attention

到这里，我们的基础架构就讲完了，那么肯定有同学会疑惑，Self-Attention和前馈网络以及encoder-decoder-Attention这些都是干什么的呢？以及transformer具体是如何工作呢？下面我来分别进行详细的讲解。

标签：黑箱,transformer,Attention,Transformer,就够,Encoder,只用,2022
From： https://www.cnblogs.com/topwang/p/17130854.html

图文详解CDC技术，看这一篇就够了！
这篇文章是对变更数据捕获(CDC)实践的介绍，而不是对特定工具的深入探讨。假设我们正在构建一个简单的Web应用程序。在大多数情况下，此类项目从最小的数据架构开始。例......
基于 Hugging Face Datasets 和 Transformers 的图像相似性搜索
基于HuggingFaceDatasets和Transformers的图像相似性搜索通过本文，你将学习使用......
一文总结当下常用的大型 transformer 效率优化方案
前言本文是一篇综述性的博客，探讨总结当下常用的大型transformer效率优化方案。本文转载自机器之心作者丨LilianWeng欢迎关注公众号CV技术指南，专注于计算机......
【保姆级】Python最新版3.11.1开发环境搭建，看这一篇就够了
工欲善其事必先利其器，在使用Python开发程序之前，在计算机上搭建Python开发环境是必不可少的环节，目前Python最新稳定版本是3.11.1，且支持到2027年，如下图所示本文手把手带你......
关于工具软件:Apipost和Apifox哪个更好用看这篇就够了
很多人搞不清楚Apipost和Apifox到底有什么区别，以下为实际体验，各位能够依据本身状况参考一下，有什么不足之处还请各位大佬多多指教。一、产品定位这块能够间接看他们的官......
BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations f
目录概基本框架代码SunF.,LiuJ.,WuJ.,PeiC.,LinX.,OuW.andJiangP.BERT4Rec:Sequentialrecommendationwithbidirectionalencoderrepresentationsfr......
Python3，我只用一段代码，就写了个词云生成器,YYDS!
1、引言小鱼：小屌丝，你在干啥呢？小屌丝：鱼哥，你看，我的PPT写的高大尚不。小鱼：这有啥高大尚的啊，小屌丝：你仔细看，往下翻一页小鱼：额。你这那是PPT，就是浴皇大帝、昂科旗等车系......
了解 Transformers 是如何“思考”的
Transformer模型是AI系统的基础。已经有了数不清的关于"Transformer如何工作"的核心结构图表。但是这些图表没有提供任何直观的计算该模型的框架表示。当研究者对......
DyTox Transformers for Continual Learning with DYnamic TOken eXpansion----阅读笔
摘要：深度网络架构努力不断学习新任务而不忘记以前的任务。最近的一个趋势表明，基于参数扩展的动态体系结构可以在持续学习中有效地减少灾难性遗忘。然而，现有的方法存在一些......
Hugging News #0203: 3.3 MB 的文生图模型、RHLF 训练框架、手机上能跑的 Transformer
每一周，我们的同事都会向社区的成员们发布一些关于HuggingFace相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为......

学会transformer，只用这一片就够了，学不会来砍我！

1.transformer的结构

相关文章

赞助商

阅读排行