论文解读（PERL）《PERL: Pivot-based Domain Adaptation for Pre-trained Deep Contextualized Embedding Models》

时间：2023-08-27 18:35:22浏览次数：51

标签：Pre Domain based text 论文 PERL pivot Pivot

Note：[ wechat：Y466551 | 可加勿骚扰，付费咨询 ]

论文信息

论文标题：PERL: Pivot-based Domain Adaptation for Pre-trained Deep Contextualized Embedding Models
论文作者：Eyal Ben-David、Carmel Rabinovitz、Roi Reichart
论文来源：2020 TACL
论文地址：download
论文代码：download
视屏讲解：click

1 介绍

　　动机：之前 Pivot-based 的方法只利用了来自源域的标记数据和来自源域和目标域的未标记数据，而忽略了合并不一定来自这些域的大量未标记语料库；

2 相关

　　Pivot features are:

- Frequent in the unlabeled data from the source and target domains；
- Among those frequent features, pivot features are the ones whose mutual information with the task label according to source domain labeled data crosses a pre-defined threshold. Features that do not meet the above two criteria form the non-pivot feature subset；

3 方法

模型框架

Step 1

　　Figure 1a：使用一个强大的预训练的 CWE 模型初始化 PERL 编码器，这里的 CWE 模型要能实现 MLM、NSP 任务；

Step 2

　　使用不同的掩码概率对 $\text{pivot}$ 和 $\text{non-pivot}$ 进行 $\text{mask}$ ，并预测 $\text{mask}$ 的词是否是 $\text{pivot}$ ；

　　　　$p\left(y_{i}=j\right)=\frac{e^{f\left(h_{i}\right) \cdot W_{j}}}{\sum_{k=1}^{|P|} e^{f\left(h_{i}\right) \cdot W_{k}}+e^{f\left(h_{i}\right) \cdot W_{\text {none }}}}$ 　　其中，$P$ 是 $\text{pivot feature}$ 的集合；

Step 3

　　在对来自源域的标记数据进行训练和对目标域进行测试时，每个输入文本首先由编码器表示，然后被输入给分类网络。因为我们的工作重点是表示学习，所以分类网络保持简单，由一个卷积层，然后是一个平均池化层和一个线性层组成。当训练下游任务时，编码器的权重会被冻结。

4 实验

Domain adaptation results

标签：Pre,Domain,based,text,论文,PERL,pivot,Pivot
From： https://www.cnblogs.com/BlairGrowing/p/17659385.html

Docker方式安装wordpress
准备拉取wordpress,mysql镜像dockerpullwordpressdockerpullmysql启动wordpress,mysql容器启动wordpress容器,将容器80端口映射到主机端口8080dockerrun-d-p8080:80--namewordpress01wordpress启动mysql容器,映射数据库端口到主机的3306,设置root密......
HyperLedger Fabric基础：搭建Fabric测试网络（三）
在本系列第二篇中，我们介绍了如何创建通道与在通道上启动链码的问题。本篇将探索如何使用Peer客户端与区域链网络通信。启动测试网络后，可以使用Peer节点CLI与网络进行交互。Peer节点CLI允许您从CLI调用已部署的智能合约、更新通道或安装和部署新的智能合约。确定当前我们仍处于test-......
论文解读（TAMEPT）《A Two-Stage Framework with Self-Supervised Distillation For Cros
论文信息论文标题：ATwo-StageFrameworkwithSelf-SupervisedDistillationForCross-DomainTextClassification论文作者：YunlongFeng,BohanLi,LiboQin,XiaoXu,WanxiangChe论文来源：2023aRxiv论文地址：download 论文代码：download视屏讲解：click1介绍动......
HyperLogLog用法
场景引入：两个概念：UV:全程UniqueVisitor，也叫独立访客量，是指通过互联网访问，浏览这个网页的自然人。1天内同一个用户多次访问该网站，只记录一次。PV：全称PageView，也叫页面访问量或点击量，用户每次访问网站的一个页面，记录一次pv，用户多次打开页面，则记录多次pv。往往用来衡量网站的流......
HyperLedger Fabric基础：搭建Fabric测试网络（二）
在本系列第一部分中，我们介绍了搭建Fabric测试网络的目的、前提，并对其主要组件作了简介。在本部分中，我们将继续搭建Fabric测试网络的过程。创建通道¶既然我们的机器上运行起了Peers节点和Ordering排序节点，我们就可以使用该脚本为Org1和Org2之间的事务创建一个Fabric通道（Channel）。通......
express的使用方法
以下是express的一些常用方法及其代码说明： 1.**设置中间件** ```javascriptapp.use((req,res,next)=>{/*...*/});``` 该方法用于设置中间件，可以对请求和响应进行一些处理。例如，可以在请求到达服务器之前对其进行验证、添加一些自定义头部信息等。 2.**......
express搭建小程序后台
以下是使用express搭建小程序后台的代码示例： 1.安装依赖 ```bashnpminstallexpressbody-parsercors``` 2.创建app.js文件 ```javascriptconstexpress=require('express');constbodyParser=require('body-parser');constcors=require('cors&#......
LuoguP7637 [BalticOI 2006 Day 1] BITWISE EXPRESSIONS
题目大意给定$N$对数据，每对数据包含两个整数$A_i$和$B_i$，表示这一对数据的$v_i$的范围：$A_i\leqv_i\leqB_i$。又将这$N$对数据分为$P$组，其中$K_i$表示第$i$组数据中有多少对数据。我们设第$i$组数据中将所有数按位与的结果为$X_i$，求......
php读取excel数据使用phpspreadsheet
首先是用composer安装phpoffice/phpspreadsheet具体代码//读取数据privatefunctionreadYewuExcel(){$reader=IOFactory::createReader("Xlsx");$reader->setReadDataOnly(TRUE);$spreadsheet=$reader->load('yewu.xlsx');......
VS插件DevExpress CodeRush v23.1 - 支持Visual Studio ARM
DevExpress CodeRush是一个强大的VisualStudio.NET插件，它利用整合技术，通过促进开发者和团队效率来提升开发者体验。CodeRush能帮助你以极高的效率创建和维护源代码。Consume-first申明，强大的模板，智能的选择工具，智能代码分析和创新的导航以及一个无与伦比的重构集，在它们的帮助......