首页 > 其他分享 >我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!

我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!

时间:2023-04-21 13:37:26浏览次数:58  
标签:语义 模型 可解 信息 我要 DSR 吹风机 潜在 IJCAI


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_机器学习

文 | 智商掉了一地

当小猪佩奇的忠实观众进行AI研究,论文配图居然是这样的风格……

在介绍接下来的内容前,我们先来看一则笑话:

小猪佩奇哭着对妈妈说:“小伙伴们都说我长得像粉色吹风机。” 猪妈妈安慰道:“尽瞎说,不过宝贝,下次说话时离妈妈远一点吧,别把妈妈新烫的头发给吹乱了。”

不知道大家有没有注意过这个现象:随着年轻一代开始步入科研的道路,学术论文的画风也越来越有趣。在自然语言处理领域可以看到,从科幻电影中的Transformer,再到儿童教育节目《芝麻街》中的BERT、ELMo、ERNIE和Big Bird,越来越多的论文作者冲破论文命名需要严肃的桎梏,给自己的模型起一些富有趣味且朗朗上口的简称,让读者可以迅速记住自己的模型,同时这些模型也不负众望地在其研究领域占据了主流地位。


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_机器学习_02

今天这篇文章的作者就在论文配图上别出心裁,给我们诠释了一位小猪佩奇爱好者在CV领域进行研究时,配图画风究竟会有多可爱。作者首次提出域信息和类别信息的解耦表达,利用双对抗网络结构学习较有影响力的类别信息。

论文题目:
Learning Disentangled Semantic Representation for Domain Adaptation

论文链接:
https://www.ijcai.org/proceedings/2019/285

点开这篇论文时,最吸引目光的无疑是这张问题图,作者借助小猪佩奇和吹风机这两类毫不相干却又有一定联系的样本,引出了本文要研究的问题。


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_深度学习_03

▲玩具的域适应示例

作者指出,现有的域自适应方法无法从特征空间提取具有域耦合信息语义信息的域不变表示,因此作者提出了用潜在可解耦语义表示(latent disentangled semantic representation)来扩展语义信息。

本文引出了以下两个问题:

  • 跨域问题中,域的不变性表示是什么?
  • 如何设计一个模型来提炼域的不变性表示?

针对第一个问题,作者从数据生成过程背后的因果机制入手,如下图所示,给定由两个独立的潜在变量生成的 x,其中域潜在变量 对域信息编码,语义潜在变量 对语义信息编码,并且假设两者相互独立。作者还考虑到域信息在不同域之间可能存在很大差异,因此推断语义潜在变量在提取域不变表示中起着重要作用


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_机器学习_04

▲数据生成过程的因果模型

对于第二个问题,利用上述数据生成机制,作者提出了一种可解耦语义表示 (Disentangled Semantic Representation, DSR) 的域适应框架,如下图所示,其中 和 分别是语义和域信息的编码器。

首先通过变分自编码器重构两个独立的潜在变量,然后通过双对抗训练网络来解耦合。


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_计算机视觉_05

▲可解耦语义表示模型的框架

重建块中,变分自编码器用于恢复语义潜在变量 和域潜在变量 。

解耦合块中,使用双对抗网络对潜在变量解耦合。图的左侧是利用了语义潜在变量 的标签对抗学习模块,融合了语义信息,并对域分类器 用梯度反转层 (GRL) 排除了所有的域信息。这是通过使用标签分类器 和域分类器 来完成的。图的右侧是域对抗学习模块,将域信息融合到 中,并从 中排除语义信息。同时将 GRL 用于标签分类器上,以便掌握来自 的所有域信息。但与语义模块不同的是,作者没有用交叉熵作为标签损失,因为目标域中的无监督学习。

实验效果

实验使用的公开数据集如下:

  1. Office-31:是视觉域自适应的Baseline,包含来自三个不同域的 4652 张图像和 31 个类别:Amazon (A),Webcam (W) 和 DSLR (D)。
  2. Office-Home:是 Office-31 的升级版本,包含来自 65 类日常对象的约 15500 张图像。该数据集分为四个域:Art (Ar),Clipart (Cl),Product (Pr) 和 Real-world (Rw)。

接下来看看在两个公开数据集上的表现:


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_人工智能_06

图中加粗表示在公开数据集上训练的最优结果。

从实验结果来看,DSR 在数据集 Office-Home 的大多数迁移任务上优于其他Baseline,尤其显著提升了硬迁移任务的分类精度,但在 W→D 和 A→D 任务上的结果低于一些比较方法,这是因为域中的样本数量过少导致 DSR 模型不足以重建可解耦的语义表示。

数据集 Office-Home 的结果也显示了 DSR 模型更容易提取相对简单的图片和更复杂的场景的语义表示,而真实图片是在现实生活中拍摄的,存在很多模棱两可的样本这样的语义信息是在域中难以被解耦合和提取。

为了验证可解耦语义表示的有效性,在任务 Ar→Cl(源域Art,目标域Clipart)上,作者还将 DSR 与两种使用类似对抗学习策略的方法利用 t-SNE 可视化进行了比较。


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_python_07

▲DANN(a)、MSTN(b)和DSR(c)提取的深度特征的t-SNE可视化。红点是源域样本,蓝点是目标域样本

可以看到,DSR 的对齐效果更佳,而 DANN 和 MSTN 都有大量样本的对齐存在错误。

小结

作者提出了一种用于无监督域自适应任务的可解耦语义表示模型 DSR ,该模型遵循数据生成过程的因果模型,在可恢复的潜在空间上提取分离的语义表示,也因此该模型还具有基于变分自编码器的潜在空间恢复基于双对抗学习的可解耦表示的特点。该方法的成功不仅为域自适应任务提供了有效的解决方案,而且为基于可解耦的学习方法开辟了可能性。

最后,说一句题外话,作者可爱的论文配图画风也是吸引我阅读这篇文章的原因之一,当越来越多的科研人员冲破学术论文严肃的桎梏时,也许研究的内容也会让读者阅读时感觉更亲切吧。


我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!_人工智能_08

标签:语义,模型,可解,信息,我要,DSR,吹风机,潜在,IJCAI
From: https://blog.51cto.com/xixiaoyao/6212568

相关文章

  • “我要做小小瑶大人的狗!”
    小轶:这真的是白鹡鸰写的作为21世纪新时代人格健全,精神独立,心理健康的有志青年,总有那么几个时刻,会让我们情不自禁,眼泪从嘴角流下地呐喊着:“我是XXX的狗!”啊!这诚恳、真挚,热烈的情感真是令人动容!如此质朴的愿望,纯洁的心意,怎么能只是口头说说,而不进行实践呢?四肢着地匍匐前进确实不太符......
  • 5 加餐(一)| 大学毕业,我要不要留在一线城市互联网公司?
    你好,我是乔新亮。前面我们聊了许多有关职业发展的基础认知。在加餐部分,我想将这些认知串联起来,回答一些在成长中,你可能会实际遇到的问题。前段时间,我和团队内外许多年轻的同学们聊了聊,大家都在讨论“那位28岁退休的字节跳动程序员”,还引用了网络上比较火的一个词,叫做:“逃离北上广......
  • 【2023.04.06】我要否定“为善不欲人知”
    从小到大家人给我的教育就是做好事不要留名,这是做好事的最高境界,因为做好事留名的话,也许会让别人觉得你贪慕名声,你是个爱慕虚荣的人像我自己的话,每个月都会固定捐款给山区孩子,或许是“为善不欲人知”的想法,我从来没有炫耀过我自己做过的这些事,因为我不想将我的道德“强行”施加给......
  • 如果我要开发一个中小学生学习的数学软件,我应该找谁去做用户调研
    如果我去开发一个中小学数学学习数学的软件,那么首先我会知道这个软件的绝大部分受众用户是中小学生,对于学习当然是自己对自己的学习情况和方法最为了解,因此我会用调查问卷并实地去询问一些中小学生的意见和学习方法。其次由于中小学生可能并不会具有较好的学习方法以及习惯,因此我......
  • 【PAT乙】1003 我要通过! (20分) 字符串条件判定
    problem“答案正确”是自动判题系统给出的最令人欢喜的回复。本题属于PAT的“答案正确”大派送——只要读入的字符串满足下列条件,系统就输出“答案正确”,否则输出“答案......
  • 练习:我要买票吗
    通过input语句获取键盘输入的身高判断身高是否超过120cm,萍通过print给出提示信息  1print("欢迎来到动物园。")2height=int(input("请输入您的身高(cm):"))3......
  • 60% 程序员大呼:我要远程办公!
    近几年数字化的普及,白领们从挤地铁、打卡、开会、写日报转变成“早上9点视频会议”,企业的办公场所也从写字楼、会议室、工位变成了手机、电脑中的线上会议室,远程办公已经成......
  • 奋斗百天我要xueC--04
    0x00指针内存中字节的编号称为地址(Address)或指针(Pointer)。地址从0开始依次增加,对于32位环境,程序能够使用的内存为4GB,最小的地址为0,最大的地址为0XFFFFFFFF。0x01......
  • Synchronized,我要一层一层剥开你的心
    三种应用方式修饰实例方法,作用于当前实例加锁,进入同步代码前要获得当前实例的锁。修饰静态方法,作用于当前类对象加锁,进入同步代码前要获得当前类对象的锁。修饰代码块......
  • 【C++小程序】《我要抽签》b1.0做好了~
    也许是的,得横空出世了如你所见这款基于\(C++\)能模仿Mrs.Yao抽签系统的cpp终于做完了啦~初期功能很少。\(BUG\)极多。所以为了您的体验:)请遵守格式代码:#includ......