Seq2Seq

2024-12-26Sequence-to-Sequence
序列到序列任务（Sequence-to-Sequence，简称Seq2Seq）是一种机器学习任务，它的目标是将一个序列（如文本、音频、图像等）映射到另一个序列。该任务广泛应用于自然语言处理（NLP）领域，尤其是在翻译、文本生成、摘要生成等任务中。具体含义：在Seq2Seq模型中，输入和输出都是序列。输入的序列可
2024-12-19图解Transformer就这30页PPT，你们真不看啊
图解Transformer就这30页PPT，你们真不看啊主要介绍了Seq2Seq模型，慢慢引出了transformer的整体模型架构，比较具体的介绍了编码器部分的数据处理过程，包括了位置编码、多头注意力机制、残差连接、LayerNorm以及前馈网络等基本结构。目录：1、Seq2Seq模型2、Transformer模型
2024-12-06事后诸葛亮分析报告
信息项内容课程名称广工计院计科34班软工作业要求位置https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13236队名：民族大团结队团队成员：姓名学号张汉洁(组长)3222004598张逸程3122004589杨富国3122004587萨姆哈尔·艾得力31
2024-12-02实验5
任务1_1源代码：1#include<stdio.h>2#defineN534voidinput(intx[],intn);5voidoutput(intx[],intn);6voidfind_min_max(intx[],intn,int*pmin,int*pmax);78intmain(){9inta[N];10intmin,max;1112prin
2024-11-25vxe-table 使用单元格选取功能
通过参数mouse-config.area启用单元格选取功能、Excel区域选取。<template><div><vxe-tableborderheight="500":column-config="{resizable:true}":mouse-config="{area:true,extension:false}"
2024-10-09深度学习对对联:探索seq2seq-couplet项目的智能对联生成
引言对联作为中国传统文化的瑰宝,一直以其对仗工整、意境深远而备受推崇。随着人工智能技术的发展,利用深度学习来生成对联成为了一个引人注目的研究方向。本文将深入探讨seq2seq-couplet项目,这是一个利用序列到序列(seq2seq)模型来实现智能对联生成的开源项目。seq2seq-couple
2024-09-22机器翻译之seq2seq训练、预测、评估代码
目录1.seq2seq训练代码2.预测代码 3.评估代码 4.知识点个人理解 1.seq2seq训练代码seq2seq的训练代码：pytorch中训练代码一般都相同类似#将无效的序列数据都变成0（屏蔽无效内容的部分）defsequence_mask(X,valid_len,value=0):"""valid_len:有效序
2024-09-02十大时间序列模型最强总结（十）序列到序列模型（Seq2Seq）
十、序列到序列模型（Seq2Seq）1.原理Seq2Seq模型是一种深度学习模型，用于处理序列到序列的任务，如机器翻译和时间序列预测。Seq2Seq模型通常由一个编码器和一个解码器组成，其中编码器处理输入序列，解码器生成输出序列。2.核心公式3.优缺点1）优点：适用于复杂的序列到序列任务，如机器翻译
2024-08-21机器学习--序列到序列模型总结
序列到序列（Seq2Seq）模型的发展历程中，随着技术的进步和研究的深入，出现了多种不同的架构。这些架构在编码器-解码器结构的基础上逐步演化，融合了多种改进策略和创新方法。以下是总结出的主要Seq2Seq模型架构：1.基础的RNNSeq2Seq模型编码器和解码器：最早的Seq2Seq模型使用简单的
2024-08-11人工智能算法工程师(高级)课程11-自然语言处理之NLP的语言模型-seq2seq模型,seq+注意力与代码详解
大家好，我是微学AI，今天给大家介绍一下人工智能算法工程师(高级)课程11-自然语言处理之NLP的语言模型-seq2seq模型,seq+注意力,word2vec与代码详解。本课程面向高级人工智能算法工程师，深入讲解自然语言处理(NLP)中的关键语言模型技术，包括seq2seq模型及其增强版加入注意力机制
2024-07-17Task2：从baseline代码详解入门深度学习
Task2：从baseline代码详解入门深度学习准备工作数据集数据集被划分为三种，分别是：训练集，开发集测试集。训练集数量最多，用于训练模型，开发集用于在训练中不断调整模型的参数，架构，测试集用于测试模型模型基于seq2seq模型主要由encoderdecoder两部分构成使用GRU模型大致可以理
2024-05-25基于附带Attention机制的seq2seq模型架构实现英译法的案例
模型架构先上图我们这里选用GRU来实现该任务，因此上图的十个方框框都是GRU块，如第二张图，放第一张图主要是强调编码器的输出是作用在解码器每一次输入的观点，具体的详细流程图将在代码实现部分给出。编码阶段1.准备工作要用到的数据集点此下载，备用地址，点击下载导入相关的
2024-03-19seq2seq项目详解
一、seq2seq和encoder-decoder关系seq2seq是从解决问题的目的角度来说的，利用的框架是encoder-decoder 二、项目例子比如我们有两个文件letters_source.txt和letters_target.txt，他们行数一致，也就是我们的训练集合，他们每一行互应（这两个文件同一行彼此长度可以不一致：比如中
2023-12-26基于seq2seq模型实现英译法
一、选题背景机器翻译的发展主要分为三个阶段：基于规则的机器翻译；基于统计的机器翻译；基于人工神经网络的机器翻译。现在神经机器翻译的主流模型是编码器-解码器模型结构。该模型由编码器与解码器两部分组成，编码器是一个循环神经网络（RNN），输入是一个词语的序列，每次向RNN单元输入一
2023-12-26基于seq2seq模型实现英译法02
一、模型设计模型的构建需要依次实现其嵌入层（embedding）、编码器（encoder）、解码器（decoder）等部分。下面以python3.6+pytorch1.3.1为例，给出了各部分的核心代码。代码4-1基于GRU的编码器classEncoderRNN(nn.Module):def__init__(self,input_size,hidden_size):super(EncoderR
2023-10-20《动手学深度学习 Pytorch版》 9.7 序列到序列学习（seq2seq）
循环神经网络编码器使用长度可变的序列作为输入，将其编码到循环神经网络编码器固定形状的隐状态中。为了连续生成输出序列的词元，独立的循环神经网络解码器是基于输入序列的编码信息和输出序列已经看见的或者生成的词元来预测下一个词元。要点：“<eos>”表示序列结束词元，一旦输
2023-06-09N6、seq2seq翻译实战-Pytorch复现
2023-05-25N5、seq2seq详解
2023-05-18NLP中的Autoencoder、Autoregressive、seq2seq模型区分
自回归、自编码器、seq2seqAutoregressiveLM特点：自回归语言模型按照特定的顺序一次生成一个token。自回归模型是单向的语言模型，适合用于文本生成。训练方式：给定之前所有的token，预测下一个token是什么。代表模型：GPT。AutoencoderLM特点：自编码器语言模型通常用于denoisin
2023-04-12seq2seq中的注意力机制
seq2seq中的注意力机制解决了长期梯度消失的问题，LSTM只解决了一部分长短期问题。transformer中采用的自注意力机制多少借鉴该方法，其最核心的公式如下图所示。Attention机制详解（一）——Seq2Seq中的Attention-知乎(zhihu.com)Q、K、V分别代表询问、键值以及数据值，本质就是根据
2023-03-19seq2seq模型案例分析
1seq2seq模型简介seq2seq模型是一种基于【Encoder-Decoder】（编码器-解码器）框架的神经网络模型，广泛应用于自然语言翻译、人机对话等领域。目前，【seq2seq+attention】（注
2023-03-17Attention与SelfAttention
目录Seq2Seq+AttentionAttention的原理方法一（Usedintheoriginalpaper）方法二（morepopular，thesametoTransformer）SummarySelfAttentionSimpleRNN与Attention当前状
2023-03-03万事皆可Seq2Seq
转自：https://kexue.fm/archives/7867以T5的预训练为例，其包含的无监督和有监督两部分都改成了Seq2Seq模式：无监督部分使用完形填空的形式输入：明月几时有，[M0]问青天，不知
2023-02-08一点seq2seq的笔记
一点seq2seq的笔记Date:2023-02-08T21:33:00+08:00毕设，看了点神经网络的内容。RNN的输入是asequenceofvector，感觉RNN像在训练一个cell，喂给cell一个vector
2022-12-07[转]Transformers使用
Transformers是由HuggingFace开发的一个NLP包，支持加载目前绝大部分的预训练模型。随着BERT、GPT等大规模语言模型的兴起，越来越多的公司和研究者采用Transformers