《深度学习原理与Pytorch实战》（第二版）（三）11-15章

时间：2024-05-06 16:14:00浏览次数：35

标签：11 编码器 15 解码 token 机器翻译 Pytorch 解码器向量

第11章神经机器翻译器——端到端机器翻译

神经机器翻译，google旗下的NMT
编码-解码模型：用编码器和解码器组成一个翻译机，先用编码器将源信息编码为内部状态，再通过解码器将内部状态解码为目标语言。编码过程对应了阅读源语言句子的过程，解码过程对应了将其重组为目标语言的过程——对应“翻译”的过程：先把大意看懂，再重新组织翻译出的新语言——书P260

embedding层的用法：
在机器学习和深度学习中，嵌入层（embedding layer）是一种常见的技术，用于将高维离散数据映射到低维连续向量空间中。它通常用于处理文本、图像、音频等数据，将它们转换成模型可以处理的形式。
在自然语言处理（NLP）中，嵌入层经常用于将词汇表中的每个单词映射到一个固定长度的实数向量。这些向量在嵌入空间中的位置被设计为捕捉单词之间的语义关系。例如，具有相似含义的单词在嵌入空间中可能会更接近。

softmax函数

编码器工作流程——书P262
编码-解码模型归纳——书P269
注意力机制——书P270
注意力网络首先是一个神经网络，包含了两个部分：一是解码器下一个时刻的输入单词，二是解码器当前的隐含层节点状态——书P271
注意力网络的输出是一组正实数，加起来等于1，是加到编码器各时间步隐含状态上的权重
使用GRU（门控循环单元）来替换普通的LSTM——书P275
GRU也是没有输出门的LSTM

第12章更强的机器翻译模型——Transformer

为了克服RNN系列对长序列建模的困难，提出了Transformer，完全使用注意力机制代替RNN复杂的网络结构——书P300
Transformer以注意力为核心构建整个编码-解码模型，解决了长序列问题，完全抛弃了RNN
RNN、LSTM为核心的机器翻译使用token，但是token都是通过cell states和其他token产生联系，而一般直接产生联系的是距离最近的token，但是这样，针对长序列就不方便
Transformer的多头自注意力模块中，每一个token需要分裂为若干个头，每个头内部又分为查询向量query、关键字向量key、值向量value三个向量，每个token的query向量都可以与句子中其他token的key向量直接交互。query与key的计算结果与value相结合，产生新的token表示——书P302
3.采用Atoken的故事来方便理解——书P304

标签：11,编码器,15,解码,token,机器翻译,Pytorch,解码器,向量
From： https://www.cnblogs.com/jzzg/p/18175183

Linux 和 Windows11双系统安装
阅读目录1.下载Linux系统2.制作Linux系统启动盘3.电脑分盘4.安装Ubuntu系统5.安装完成后可能遇到的黑屏问题解决回到顶部1.下载Linux系统下载Linux系统的镜像文件，Linux系统有很多版本，Linux指的是系统内核，笔者下载的是Ubuntu系统，大家可以根据需要下载其他系统。Ubuntu......
win11专业版密钥最新
Windows11专业版是专为高性能需求的专业人士设计的版本，它提供了一些额外的功能和安全性，使其更适合专业用途。主要功能包括：高级安全功能：Windows11专业版包括BitLocker设备加密、WindowsDefenderApplicationGuard和WindowsHelloforBusiness等高级安全功能，可帮......
P3811 【模板】模意义下的乘法逆元
题目：P3811【模板】模意义下的乘法逆元【模板】模意义下的乘法逆元题目背景这是一道模板题题目描述给定$n,p$求$1\simn$中所有整数在模$p$意义下的乘法逆元。这里$a$模$p$的乘法逆元定义为$ax\equiv1\pmodp$的解。输入格式一行两个正整数$n,p$。输出格式......
RTL8211F以太网千兆RGMII开发板
1.概述 RGMII 开发板主芯片是RTL8211FD。配套国产GOWIN的2AR-18和NR-9C的开发板，测试RGMII的千兆以太网数据发送和接收功能。开发板的代码是基于MAC模式，通过循环发送计数器来判断包发送和接收是否正确。二. 配套资料三.配套开发板 ......
halcon 22.11.1 license 异常处理
halcon版本: progress(订阅版)和steady(永久版);不同的版本需要不同的license license需要每月一换license下载地址 lovelyyoshino/Halcon_licenses:Halconlicensesactivation(github.com) license安装: 解压后根据progress(订阅版)或steady(永久版)拷贝带......
AP5151 是一种低压差、线性降压、固定输出电流的LED恒流驱动器。除LED外，AP5151 无需外
AP5151是一种低压差、线性降压、固定输出电流的LED恒流驱动器。除LED外，AP5151无需外接其它元器件即可构成一个恒流输出的LED驱动电路。AP5151内置过热保护功能，可有效保护芯片，避免结温超过120oC时因过热而造成损坏。AP5151还集成了LED短路保护、电源欠压保护功能。此外，AP......
AP5152 是一种输出电流可调的、低压差的 LED 恒流驱动器
AP5152是一种输出电流可调的、低压差的LED恒流驱动器，仅需一个外接电阻和一个NMOS管就可以构成一个完整的LED恒流驱动电路，调节该外接电阻就可以调节输出电流，输出电流可调范围为100mA到3000mA。AP5152内置过热保护功能，可有效保护芯片，避免温度超过120oC时因过热而造成损......
AP5151 是一种低压差、线性降压、固定输出电流的LED恒流驱动器。
AP5151是一种低压差、线性降压、固定输出电流的LED恒流驱动器。除LED外，AP5151无需外接其它元器件即可构成一个恒流输出的LED驱动电路。AP5151内置过热保护功能，可有效保护芯片，避免结温超过120oC时因过热而造成损坏。AP5151还集成了LED短路保护、电源欠压保护功能。此外，AP......
TinyVue 3.15.0 正式发布，推出全新的 Charts 图表组件底座，功能更强、图表更丰富！
你好，我是Kagol。我们非常高兴地宣布，2024年4月8日，TinyVue发布了v3.15.0......
web server apache tomcat11-31-websocket
前言整理这个官方翻译的系列，原因是网上大部分的tomcat版本比较旧，此版本为v11最新的版本。开源项目从零手写实现tomcatminicat别称【嗅虎】心有猛虎，轻嗅蔷薇。系列文章webserverapachetomcat11-01-官方文档入门介绍webserverapachetomcat11-02-setup启动web......

《深度学习原理与Pytorch实战》（第二版）（三）11-15章

第11章神经机器翻译器——端到端机器翻译

第12章更强的机器翻译模型——Transformer

相关文章

赞助商

阅读排行

《深度学习原理与Pytorch实战》（第二版）（三）11-15章

第11章 神经机器翻译器——端到端机器翻译

第12章 更强的机器翻译模型——Transformer

相关文章

赞助商

阅读排行

第11章神经机器翻译器——端到端机器翻译

第12章更强的机器翻译模型——Transformer