论文阅读：ERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generatio

时间：2025-01-07 16:02:38浏览次数：6

标签：Pre training scale ERNIE 建模任务 3.0 自然语言句子

简介

ERNIE 3.0 融合了自回归和自编码，在由纯文本和大规模知识图谱组成的 4TB 语料库上训练大规模知识增强模型，传播了自然语言理解、自然语言生成和知识提取三个任务范式。

框架

自然语言处理的不同任务范式始终依赖于相同的底层抽象特征，例如词汇信息和句法信息，但顶级具体特征的要求是不相容的，其中自然语言理解任务具有学习语义连贯性的倾向，而自然语言生成任务期望进一步的上下文信息。
流行的统一预训练策略是不同任务采用共享的transformer网络，并用特定的自注意力掩码来控制预测条件的上下文。
与流行的统一预训练策略不同，ERNIE 3.0 设计了一个新的连续多范式统一预训练框架。
考虑到传统的较低层在所有任务之间共享，而顶层是特定于任务的。ERNIE 3.0 采用了通用表示模块和两个任务特定表示模块的协作架构，即自然语言理解（NLU）特定表示模块和自然语言生成（NLG）特定表示模块，使不同的任务范式能够共享在共享网络中学习到的底层抽象特征并分别利用在他们自己的特定于任务的网络中学习到的特定于任务的顶层具体特征。

通用表示模块

ERNIE 3.0 使用多层Transformer-XL作为主干网络（类似于Transformer，但引入了一个辅助递归记忆模块来帮助建模更长的文本，记忆模块只对控制注意力掩码矩阵的自然语言生成任务有效）。

任务特定表示模块

任务特定表示模块也是使用一个基础模型大小的多层Transformer-XL。两个特定任务分别为自然语言理解（双向建模）和自然语言生成（单向建模）。

预训练任务

单词感知预训练任务

1.知识掩码语言建模：ERNIE 1.0 通过知识集成来增强表示。它引入了短语掩码和命名实体掩码来帮助模型了解本地上下文和全局上下文的依赖关系信息。
2.文档语言建模：生成式预训练模型通常使用传统的语言模型（GPT等）或序列到序列的语言模型（BART等）作为预训练任务，ERNIE 3.0 选择传统的语言模型作为预训练任务，来降低网络复杂性。同时，为了使NLG网络能够对较长的文本进行建模，ERNIE 3.0 引入了ERNIE-Doc中提出的增强递归记忆机制，通过将向下移动一层的递归更改为同一层递归，它可以比传统递归 Transformer 建模更大的有效上下文长度。

结构感知预训练任务

1.句子重排序：ERNIE 2.0 引入的句子重排序旨在通过重新组织排列的片段来学习句子之间的关系。在预训练期间，将给定段落随机分为1到m个片段，并随机排列，建模为k分类问题。
2.句子距离：它是下一句预测任务的扩展，建模为3分类问题：两个句子相邻、两个句子不相邻，但分别位于同一文档和两个不同的文档中。

知识感知预训练任务

为了将知识整合到预训练语言模型中，引入了通用知识文本预测，它是知识掩码语言模型的扩展。
给定一对来自知识图谱的三元组和来自百科全书的相应句子，随机掩盖三元组中的关系或句子中的单词进行预测，这个过程的本质类似于关系提取任务中的远程监督算法（远程监督算法假定，如果两个实体参与一个关系，则包含这两个实体的任何句子都可能表示该关系）。

标签：Pre,training,scale,ERNIE,建模,任务,3.0,自然语言,句子
From： https://www.cnblogs.com/zinger/p/18632328

EmbedPress Pro v3.6.10 — WordPress多合一嵌入插件
获取：EmbedPressProv3.6.10— WordPress多合一嵌入插件 EmbedPressPro是一款高级插件，主要用于在网站（WordPress网站）中轻松嵌入各种类型的多媒体内容。一、主要功能多媒体嵌入它支持嵌入来自众多流行平台的内容。例如，可以嵌入YouTube、Vimeo等视频平台的视频。这意味......
DevExpress中DataControl的分页显示方法
在网上搜索了下，大多使用自定义方法去计算实现，其实DevExpress提供了分页控件XPPageSelector和导航控件DataNavigator可以很方便地实现分页及导航控制。添加控件这里我用到了XPCollection、PageSelector、DataNavigatorXPCollection用于绑定数据源PageSelector的Collection绑......
LivePusherContext.stopPreview
LivePusherContext.stopPreview(Objectobject)基础库2.7.0开始支持，低版本需做兼容处理。以Promise风格调用：不支持小程序插件：支持相关文档:live-pusher组件功能描述关闭摄像头预览参数Objectobject属性类型默认值必填说明successfunction否......
wx.stopRecord
wx.stopRecord(Objectobject)从基础库1.6.0开始，本接口停止维护，请使用wx.getRecorderManager代替以Promise风格调用：支持小程序插件：支持，需要小程序基础库版本不低于1.9.6功能描述停止录音。参数Objectobject属性类型默认值必填说明successfunction......
前端实现xlsx文件的读取并网页编辑，结合exceljs和x-data-spreadsheet，参考
1.安装依赖确保你已经安装了x-data-spreadsheet和exceljs，以及中文语言包：npminstallx-data-spreadsheetexceljs或者yarnaddx-data-spreadsheetexceljs2.导入和配置x-data-spreadsheet在你的Vue组件中，正确导入x-data-spreadsheet和中文语言包，并设置语言为中......
Scalable Methods for 8-bit Training of Neural Networks
目录概RangeBatchNormalization代码BannerR.,HubaraI.,HofferE.andSoudryD.Scalablemethodsfor8-bittrainingofneuralnetworks.NeurIPS,2018.概本文针对BatchNorm模块在低精度(8-bit)的情况下进行一个合适的改进.RangeBatchNormalization对于......
express项目部署到Linux服务器中
1.确保你的Express项目已经构建完成，并且可以在本地环境正常运行。2.将你的项目代码上传到Linux服务器。你可以使用FTP、SCP或者Git来上传3.在Linux服务器上安装Node.js和npm。4.安装项目依赖。在项目根目录下运行npminstall5.启动你的Express应用。使用npmstart或者直接用no......
express项目搭建
1.使用npm安装Express框架npminstallexpress--save2.创建基本的服务器文件在项目根目录下创建一个名为app.js的文件，并添加以下代码以创建基本的Express服务器点击查看代码constexpress=require('express');constapp=express();constPORT=process.env.......
comfyui-SD线稿一键转真人，极简式工作流分享-菜鸟级教程有手就行_image scale to side
大家好我是AIGC阿道夫在数字艺术和图像处理的新时代，技术的进步不断拓宽着创意的边界。ComfyUI提供了一套高效、易用的工作流，通过简单的节点操作即可实现从线稿到真人图像的转换。这一技术不仅简化了创作流程，还极大地提升了图像生成的质量和效率。本文将详细介绍这一工作......
集成CommitLInt+ESLint+Prettier+StyleLint+LintStaged
==代码可读性低代码====代码规范落地难====代码格式难统一====代码质量低下==配置ESLintESLint是一个用来识别ECMAScript并且按照规则给出报告的代码检测工具，使用它可以避免低级错误和统一代码的风格。它拥有以下功能：查出JavaScript代码语法问题。根据配置......