首页 > 其他分享 >自然语言生成任务中的5种采样方法介绍和Pytorch代码实现

自然语言生成任务中的5种采样方法介绍和Pytorch代码实现

时间:2024-02-18 10:56:27浏览次数:35  
标签:采样 候选 词语 生成 Pytorch 序列 自然语言

在自然语言生成任务(NLG)中,采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。

束搜索(Beam Search)是贪婪解码的一种扩展,通过在每个时间步保留多个候选序列来克服贪婪解码的局部最优问题。

在每个时间步保留概率最高的前几个候选词语,然后在下一个时间步基于这些候选词语继续扩展,直到生成结束。束搜索通过考虑多个候选词语路径,可以在一定程度上增加生成文本的多样性。

在束搜索中,模型在每个时间步会生成多个候选序列,而不是仅选择一个最优序列。模型会根据当前已生成的部分序列和隐藏状态,预测下一个时间步可能的词语,并计算每个词语的条件概率分布。

上图的每一步中,只保留两条最可能的路径(根据beam =2),而所有其他都被丢弃。此过程将继续进行,直到满足停止条件,该停止条件可以是生成序列结束令牌或达到最大序列长度的模型。最终输出将是最后一组路径中具有最高总体概率的序列。

https://avoid.overfit.cn/post/42c2631bc56347849d538768d84d47c2

标签:采样,候选,词语,生成,Pytorch,序列,自然语言
From: https://www.cnblogs.com/deephub/p/18018922

相关文章

  • conda安装gpu版本pytorch与gpu版本tensorflow
    创建环境进入环境nvidia-smi查看cuda版本,根据cuda版本安装对应版本的pytorch,在pytorch官网可以查看,版本不合适可以使用较低版本cuda的torch,使用官网提供的命令行安装即可,importtorch``print(torch.cuda.is_available())验证安装结果。tensorflow的安装要在环境中安装cudatoolki......
  • pytorch深度学习入门(8)之-Torchaudio使用Tacotron2 文本转语音
    https://blog.csdn.net/ajunbin859/article/details/134380417?ops_request_misc=&request_id=&biz_id=102&utm_term=pytorch%E7%89%88%E6%9C%AC%E7%9A%84tacotron%E8%AF%A6%E7%BB%86%E5%AE%89%E8%A3%85%E6%95%99%E7%A8%8B&utm_medium=distribute.pc_search_r......
  • pytorch3d 安装
    分享一下在Ubuntu20.04系统上安装PyTorch3D的经验,尤其是当遵循官方教程却遇到安装困难时。PyTorch3D是由FacebookAIResearch团队开发的,旨在支持与3D数据相关的深度学习任务,包括但不限于3D形状的建模、渲染和视觉理解。准备工作在安装PyTorch3D之前,首先需要确保您的系统已安装......
  • 中国的AI领域发展的重大不足 —— 数据缺少,尤其是自然语言领域(NLP)、大模型领域
    全世界公开可用的语言文本中绝大部分是英文文本,其中中文文本只有1.5%相关:China'sBettingBigOnArtificialIntelligence.CouldTheUSLoseTheAIRace?|Insight......
  • pytorch MNIST数据集手写数字识别
    MNIST包括6万张28x28的训练样本,1万张测试样本,很多教程都会对它”下手”几乎成为一个“典范”,可以说它就是计算机视觉里面的HelloWorld。所以我们这里也会使用MNIST来进行实战。importtorchimporttorch.nnasnnimporttorch.nn.functionalasFimporttorch.optimasopt......
  • 带通采样定理
    对信号进行处理时,要通过采样、量化、编码将模拟信号转换为数字信号,其中采样最为关键,只有经过模数转换和数模转换后信号还能保持不变的通信才算完整可靠。采样定理说明了采样频率和信号频谱之间的关系,是模拟信号数字化的基本依据。低通采样定理(奈奎斯特采样定理)$$f_s\geq2f_h$......
  • offline 2 online | 重要性采样,把 offline + online 数据化为 on-policy samples
    论文标题:Offline-to-OnlineReinforcementLearningviaBalancedReplayandPessimisticQ-EnsembleCoRL2021,4个weakaccept。pdf:https://arxiv.org/pdf/2107.00591.pdfhtml:https://ar5iv.labs.arxiv.org/html/2107.00591openreview:https://openreview.net/forum?id=......
  • pytorch 多机单卡分布式训练配置笔记.18010304
    pytorch多机单卡分布式训练配置笔记记录通过torchrun进行pytorch的分布式训练配置方法,示例代码为基本的分布式训练框架代码,无实际功能环境操作系统:Ubuntu22.04Python环境:anaconda23.11.0、Python3.8pytorch:2.1.2编写代码将代码保存为main.py模型训练代码写到train函数......
  • pytorch数据集MNIST训练与测试实例
      importosimporttorchimportnumpyasnpfromtorch.utils.dataimportDataLoaderfromtorchvision.datasetsimportMNISTfromtorchvision.transformsimportCompose,ToTensor,Normalizefromtorch.optimimportAdamimporttorch.nnasnnimporttorch.nn.......
  • 自然语言处理库之spaCy初探
    一、自然语言处理简介自然语言处理(NaturalLanguageProcessing,简称NLP)是一门研究人类语言与计算机之间交互的领域,旨在使计算机能够理解、解析、生成和处理人类语言。NLP结合了计算机科学、人工智能和语言学的知识,通过各种算法和技术来处理和分析文本数据。近年来,随着深度学习技......