论文解读《Modeling Discriminative Representations for Out-of-Domain Detection with Supervised Contrastive

时间：2023-03-19 23:25:10浏览次数：58

标签：adv Domain torch sum Contrastive mask Detection exp boldsymbol

论文信息

论文标题：Modeling Discriminative Representations for Out-of-Domain Detection with Supervised Contrastive Learning
论文作者：Zhiyuan Zeng, Keqing He, Yuanmeng Yan, Zijun Liu, Yanan Wu, Hong Xu, Huixing Jiang, Weiran Xu
论文来源：ACL 2021
论文地址：download
论文代码：download
引用次数：

1 前言

　　贡献：

- 提出了一个有监督的对比学习目标，通过把属于同一类别的域内意图拉到一起，使类内方差最小化，通过把不同类别的样本推开，使类间方差最大化；
- 采用了一种对抗性的增强机制，以获得潜伏空间中样本的假性不同观点；

2 方法

　　整体框架：

　　损失函数：

　　　　交叉熵损失函数：

　　　　　　$\mathcal{L}_{C E}=\frac{1}{N} \sum_{i}-\log \frac{e^{W_{y_{i}}^{T} s_{i} / \tau}}{\sum_{j} e^{W_{j}^{T} s_{i} / \tau}}$

　　　　最大边际余弦损失 (LMCL)：　　　　

　　　　　　$\mathcal{L}_{L M C L}=\frac{1}{N} \sum_{i}-\log \frac{e^{W_{y_{i}}^{T} s_{i} / \tau}}{e^{W_{y_{i}}^{T} s_{i} / \tau}+\sum_{j \neq y_{i}} e^{\left(W_{j}^{T} s_{i}+m\right) / \tau}}$

　　　　Note：LMCL在负类上添加了一个标准化的决策边际，并迫使模型明确地区分正类和负类。

　　　　对比损失（SCL）：

　　　　　　$\begin{aligned}\mathcal{L}_{S C L}= & \sum_{i=1}^{N}-\frac{1}{N_{y_{i}}-1} \sum_{j=1}^{N} \mathbf{1}_{i \neq j} \mathbf{1}_{y_{i}=y_{j}} \log \frac{\exp \left(s_{i} \cdot s_{j} / \tau\right)}{\sum_{k=1}^{N} \mathbf{1}_{i \neq k} \exp \left(s_{i} \cdot s_{k} / \tau\right)}\end{aligned}$

　　数据增强：

　　　　对抗攻击：

　　　　　　$\mathcal{L}_{C E}: \boldsymbol{\delta}=\underset{\left\|\boldsymbol{\delta}^{\prime}\right\| \leq \epsilon}{\arg \max } \mathcal{L}_{C E}\left(\boldsymbol{\theta}, \boldsymbol{x}+\boldsymbol{\delta}^{\prime}\right)$

　　　　　　$\boldsymbol{\delta}=\epsilon \frac{g}{\|g\|} ; \text { where } g=\nabla_{\boldsymbol{x}} \mathcal{L}_{C E}(f(\boldsymbol{x} ; \boldsymbol{\theta}), y)$

　　　　　　$\boldsymbol{x}_{a d v}=\boldsymbol{x}+\boldsymbol{\delta}$

3 代码

最大边际余弦损失：

def lmcl_loss(probs, label, margin=0.35, scale=30):
    probs = label * (probs - margin) + (1 - label) * probs
    probs = torch.softmax(probs, dim=1)
    return probs

对比损失：

def pair_cosine_similarity(x, x_adv, eps=1e-8):
    n = x.norm(p=2, dim=1, keepdim=True)
    n_adv = x_adv.norm(p=2, dim=1, keepdim=True)
    return (x @ x.t()) / (n * n.t()).clamp(min=eps), (x_adv @ x_adv.t()) / (n_adv * n_adv.t()).clamp(min=eps), (x @ x_adv.t()) / (n * n_adv.t()).clamp(min=eps)


def nt_xent(x, x_adv, mask, cuda=True, t=0.1):
    x, x_adv, x_c = pair_cosine_similarity(x, x_adv)
    x = torch.exp(x / t)
    x_adv = torch.exp(x_adv / t)
    x_c = torch.exp(x_c / t)
    mask_count = mask.sum(1)
    mask_reverse = (~(mask.bool())).long()
    if cuda:
        dis = (x * (mask - torch.eye(x.size(0)).long().cuda()) + x_c * mask) / (x.sum(1) + x_c.sum(1) - torch.exp(torch.tensor(1 / t))) + mask_reverse
        dis_adv = (x_adv * (mask - torch.eye(x.size(0)).long().cuda()) + x_c.T * mask) / (x_adv.sum(1) + x_c.sum(0) - torch.exp(torch.tensor(1 / t))) + mask_reverse
    else:
        dis = (x * (mask - torch.eye(x.size(0)).long()) + x_c * mask) / (x.sum(1) + x_c.sum(1) - torch.exp(torch.tensor(1 / t))) + mask_reverse
        dis_adv = (x_adv * (mask - torch.eye(x.size(0)).long()) + x_c.T * mask) / (x_adv.sum(1) + x_c.sum(0) - torch.exp(torch.tensor(1 / t))) + mask_reverse
    loss = (torch.log(dis).sum(1) + torch.log(dis_adv).sum(1)) / mask_count
    return -loss.mean()

标签：adv,Domain,torch,sum,Contrastive,mask,Detection,exp,boldsymbol
From： https://www.cnblogs.com/BlairGrowing/p/17234286.html

迁移学习（）《Energy-based Out-of-distribution Detection》
论文信息论文标题：Energy-basedOut-of-distributionDetection论文作者：WeitangLiu,XiaoYunWang,JohnD.Owens,YixuanLi论文来源：NeurIPS2020论文地址：download 论......
《Detection of Malicious Code Variants Based on Deep Learning》
Abstract随着互联网的发展，恶意代码攻击呈指数级增长，其中恶意代码变种被列为互联网安全的关键威胁之一。检测恶意代码变体的能力对于防范安全漏洞、数据窃取和其他危险至关......
[论文阅读] A survey on anomaly detection for technical systems using LSTM networ
本要是对于原文的部分内容翻译、摘录。详情请阅读原文。（未看完）引言为了解决检测具有动态和时变特征的复杂上下文异常的问题，新的有前途的循环神经网络(RNN)体系结构出现了......
虚假新闻检测（CALN）《Open-Topic False Information Detection on Social Networks with
论文信息论文标题：Open-TopicFalseInformationDetectiononSocialNetworkswithContrastiveAdversarialLearning论文作者：GuanghuiMa,ChunmingHu,LingGe,Hon......
论文解读（ToAlign）《ToAlign: Task-oriented Alignment for Unsupervised Domain Adapta
论文信息论文标题：ToAlign:Task-orientedAlignmentforUnsupervisedDomainAdaptation论文作者：GuoqiangWei,CuilingLan,WenjunZeng,ZhizhengZhang,ZhiboChen......
迁移学习（FACT）《A Fourier-based Framework for Domain Generalization》
论文信息论文标题：AFourier-basedFrameworkforDomainGeneralization论文作者：QinweiXu,RuipengZhang,YaZhang,YanfengWang,QiTian论文来源： CVPR2021论文地......
迁移学习（CDAN）《Conditional Adversarial Domain Adaptation》（已复现迁移）
论文信息论文标题：ConditionalAdversarialDomainAdaptation论文作者：YaroslavGanin,EvgeniyaUstinova,HanaAjakan,PascalGermain论文来源：JMLR2016论文地址：downl......
LightGCL: Simple Yet Effective Graph Contrastive Learning for Recommendation
目录概符号说明基本流程模型的基本流程另一个View优化代码CaiX.,HuangC.,XiaL.andRenX.LightGCL:Simpleyeteffectivegraphcontrastivelearningforreco......
Azure虚拟桌面专题之十一：解决DomainTrustCheck失败导致会话主机状态不可用问题
在创建完主机池并添加会话主机之后，在主机池概述中发现虚拟机总数和不可用状态数量一样，也就是说所有的虚拟机状态都处于不可用刚开始创建之后的几分钟内状态不可用是正常现象......
mmcv (mmdetection)安装教程
mmcv的安装会有很多cuda、pytorch版本适配的问题，如果版本不适配，会报各种错误，比如ModuleNotFoundError:Nomodulenamed'mmcv._ext'。mmdetection官方建议用mim进行安装......

论文解读《Modeling Discriminative Representations for Out-of-Domain Detection with Supervised Contrastive

论文信息

1 前言

2 方法

3 代码

相关文章

赞助商

阅读排行