指针网络原理分析

时间：2023-11-16 20:46:03浏览次数：32

标签：输出 RNN 词元网络序列原理输入指针

不明确的地方，请看原文：指针网络

一些难理解的关键词

combinatorial problem （组合问题）：组合问题的目标是在一组有限集合中找出能够同时满足一组约束的一个满意解，在本文的语境下，是指对于给定的词元输入序列，找出能够满足一组约束的词元输出序列，作为满意解。
token （词元）在本文中，词元是指输出序列中的元素，共有两类，分别是特殊词元和规则词元。特殊词元表示输出序列的开始或结束，规则词元是一个列表，列表中的元素用于辨析相应输入序列的不同元素。

文章总结

该文的主要目标是解决组合问题
作者的目标是建立一个模型，该模型能够按照一组约束将边长的输入转换为正确的输出，注意，目标输出需要满足该组约束条件
基于RNN建立的模型只能解决输入和输出具有相同尺度的问题（例如，输入序列的词典包含20个词，输出序列的词典必须与输入序列的词典一致）

引言中的启示

图中a，b分别是序列到序列的模型结构和指针网络的模型结构

指针网络由encoder RNN 和 decoder RNN 两部分组成，右侧的生成的指针会到输入序列中查找关键信息
指针网络的decoedr RNN (生成网络)部分在每一个时间步都会生成一个特定于输入序列所有元素的softmax分布作为输出向量，每一个输出向量中的元素值都在[0,1]内，同一输出向量中的所有元素之和为1

序列模型中的启示

假设有一个样本对为（P,Cp）其中，P = {P1,P2,...,Pn}是输入序列，Cp是目标输出序列，m(P)输入序列元素的索引，θ是RNN模型中的权重参数，m(P) 在（1，2，3，..., n）内，那么当前序列是目标输入序列的正确子序列的概率为：

对θ进行最大似然估计

估计出θ参数后，后续便可以直接输入新的序列，基于参数计算得出目标序列，完成推理过程

关键点：
1. 当输入序列的词典长度为n时，输出序列的词典长度也为n，所构建的模型不适用于具有长度非n的词典的输入序列
2. Decoder RNN 的隐藏层有两种用途，一是作为RNN下一个时间步的输入，二是用于计算当前时间步输出的词元
3. 上述公式中的W是预先随机初始化的，其形状受先验的字典尺寸的影响，softmax最终输出的向量的维度与输出字典的尺寸大小相同

指针网络的创新

基于固定大小词典的生成softmax分布的序列到序列模型，不能用于输出词典与输入序列长度相等的问题，为了解决这个问题，作者引入进行了如下的计算改进，直接利用α的权重大小作为指针，从输入序列中检索到对应的词元，作为当前词元的输出。

标签：输出,RNN,词元,网络,序列,原理,输入,指针
From： https://www.cnblogs.com/arkon/p/17837158.html

关于网络的一些疑问
1.物理层，信号传输原理，信息传输率（比特率），带宽，码元传输率（波特率）。问题一：信号传输的时候，是模拟状态，还是数字状态？问题二：调制的时候，探测信号，是探测到用1表示，没探测到用0表示吗？于是，我自己找了些资料1、信道模型的分类调制信道------模拟信道------调制器的输出端到解调器的输入......
软件测试/人工智能|一文告诉你ChatGPT原理与架构
简介ChatGPT是今年最火的互联网应用，ChatGPT给我们的工作和生活带来了巨大便利，帮我们写文案，帮我们写代码等，但是当我们在于ChatGPT对话时，我们是否有想过，这么强大的一个工具，它背后的技术原理是什么？它的技术架构是怎样的？本文就告诉大家ChatGPT的原理与架构。ChatGPT的主要特点OpenAI使......
软件测试/人工智能|一文告诉你ChatGPT原理与架构
简介ChatGPT是今年最火的互联网应用，ChatGPT给我们的工作和生活带来了巨大便利，帮我们写文案，帮我们写代码等，但是当我们在于ChatGPT对话时，我们是否有想过，这么强大的一个工具，它背后的技术原理是什么？它的技术架构是怎样的？本文就告诉大家ChatGPT的原理与架构。ChatGPT的主要特点Open......
网络安全和隐私保护技术
一、定义网络安全和隐私保护技术是指在互联网和其他网络环境中，通过技术手段保护网络系统、网络数据和用户隐私免于受到恶意攻击、非法访问、窃取或滥用。网络安全和隐私保护技术是保护网络安全和用户隐私的重要手段，是保障互联网和其他网络环境正常运作和用户权益的重要保障。二、发......
Windows任务管理器禁用开机启动项原理
从win10开始，任务管理器加入了启动项管理。这里主要是针对注册表中和startup文件夹中的启动项进行管理。而通过服务、计算任务的启动项不会在这里显示。这里禁用的主要原理是：在以下两个位置创建对应的项 HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersion\Exp......
交换机原理
交换机品牌华为、华硕、惠普、思科什么是交换机交换机将其他网络设备(如交换机、路由器、网络防火墙、无线介入点)和所有终端设备（如计算机、服务器、网络摄像头、网络打印机）连接在一起，实现彼此的通信。交换机是构建局域网络不可或缺的集线设备。作为局域网通信的重要枢纽和......
网络文件共享服务
存储类型：DAS：直连式存储NAS：网络附件存储——存储和管理空间都在远程SAN：存储区域网络——可以使用空间，管理也是你来管理双通道的协议：FTP端口号：20：传输权限元信息——命令通道21：实际数据——数据通道vsftpd/etc/vsftpd/vsftpd.conf如果你在网络共享服务中有上传的或者写的......
Eureka原理
学习自：【精选】Eureka原理看这一篇就够了_阿小木的愤怒的博客-CSDN博客1、分布式分布式系统：由多个应用程序协同来完成任务的一种工作模式系统。这里的任务可能是一个下单操作、复杂的统计计算、存储一个超大数据等等。总之这种任务不适合或无法由单个程序独立完成，需要多个程序协......
云电脑运行原理分析
本文分享自天翼云开发者社区《云电脑运行原理分析》，作者：大利一、虚拟化技术虚拟化技术是云电脑运行的核心技术之一。它可以将物理服务器虚拟化成多个虚拟机，每个虚拟机都拥有独立的操作系统和应用程序运行环境。虚拟机之间相互隔离，互不影响。虚拟化技术可以显著提高服务器的利用......
git 终极原理
git分为工作区，暂存区本地仓库和远程仓库，他们的关系如下本地工作区有修改，但是没有提交，此时又gitpull了远程仓库会怎么样，会提示有修改没有提交，无法pull，请先add/commit提交以后再pull通过gitstatus命令查看有没有工作区的修改先提交本地修改，然后再pull工作区文件没有冲突，自......