首页 > 其他分享 >论文解读 | 解释和利用对抗性示例

论文解读 | 解释和利用对抗性示例

时间:2023-08-23 18:34:41浏览次数:36  
标签:解读 训练 示例 模型 对抗性 神经网络 分类器

原创 | 文 BFT机器人

论文解读 | 解释和利用对抗性示例_线性模型



摘要

ABSTRACT


这篇论文研究了神经网络和其他机器学习模型在错误分类对抗性示例方面的问题。对抗性示例是通过对数据中的示例应用微小但故意的扰动来生成的,导致模型输出错误答案。以往的解释主要集中在非线性和过拟合上,然而,本文提出了一种不同的观点,认为神经网络易受对抗性扰动影响的主要原因是其线性特性。这个观点得到了新的定量结果的支持,同时也首次解释了这种现象的跨架构和跨训练集泛化的特点。此外,研究者基于这个观点提出了一种简单而快速的生成对抗性示例的方法。通过将这种方法应用于对抗性训练,他们在MNIST数据集上的maxout网络测试中减少了测试集误差。


01

介绍


这节介绍了一个有趣的发现,即最先进的神经网络和其他机器学习模型,包括那些采用深度学习方法的,很容易受到对抗性示例的影响。对抗性示例是一种在输入数据中故意引入微小扰动,以使模型产生错误分类的现象。论文指出,这些机器学习模型在错误分类的对抗性示例与正确分类的原始示例之间的差异很小。即使是使用不同架构在不同子集上训练的模型也可能对相同的对抗性示例产生错误分类,这揭示了训练算法中的盲点。


研究者认为对抗性示例揭示了现有训练算法的局限性。虽然一些推测认为这可能是因为深度神经网络的极端非线性特性,或者模型平均和正则化等问题,但论文证明了这些假设是不必要的。事实上,高维空间中的线性行为就足以产生对抗性示例。基于这一观点,研究者提出了一种快速生成对抗性示例的方法,并且强调对抗性训练具有实用性。此外,他们指出,除了常用的正则化策略如dropout、预训练和模型平均外,对抗性训练可以提供额外的正则化好处。然而,常见的正则化方法并不能显著降低模型对对抗性示例的脆弱性,但将模型从非线性转变为类似RBF网络这样的非线性模型族可以实现这一点。


解释表明,在易于训练的线性模型与抵抗对抗性扰动的非线性模型之间存在一种紧张的平衡关系。最终,论文提出,通过设计更强大的优化方法,可以成功地训练更多的非线性模型,从而可能避免这种平衡。


02

相关工作


Szegedy等人演示了神经网络和相关模型的各种有趣的特性。与本文最相关的包括:


  • l 盒约束L-BFGS可以可靠地找到对抗性示例。
  • l 在一些数据集上,如ImageNet (Deng et al ., 2009),对抗性示例与原始示例非常接近,以至于人眼无法区分差异。
  • l 相同的对抗性示例经常被具有不同架构的各种分类器错误分类,或者在训练数据的不同子集上进行训练。
  • l 浅层softmax回归模型也容易受到对抗性示例的影响
  • l 对抗性示例的训练可以使模型正则化——然而,由于需要在内环中进行昂贵的约束优化,这在当时是不切实际的。


这些结果表明,现代机器学习技术所构建的分类器,即使在测试集上表现出色,仍然未能真正学习决定正确输出标签的潜在概念。相反,这些算法似乎建立在一个局限的范围内,可以有效处理自然数据,但在处理概率较低的数据空间点时表现不佳。这一点尤其令人失望,因为流行的计算机视觉方法使用卷积神经网络特征来近似感知距离,而如果拥有微小感知距离的图像对应于网络表示中完全不同的类别,那么这种相似性度量显然存在缺陷。


03

对抗性例子的线性解释


在许多问题中,单个输入特征的精度是有限的。例如,数字图像通常每像素只使用8位,因此它们丢弃动态范围1/255以下的所有信息。由于特征的精度是有限的,如果扰动η的每个元素都小于特征的精度,那么分类器对输入x的响应不同于对抗性输入˜x: = x + η是不合理的。形式上,对于类分离良好的问题,我们期望分类器将相同的类分配给x和,只要||η||∞小到足以被与我们的问题相关的传感器或数据存储设备丢弃。


考虑一个权向量w和一个对抗性例子˜x:之间的点积:


论文解读 | 解释和利用对抗性示例_正则化_02



对抗性扰动使活化增大

论文解读 | 解释和利用对抗性示例_神经网络_03


这个解释表明,如果一个简单的线性模型的输入有足够的维数,它可以有对抗性的例子。先前对抗性例子的解释援引了神经网络的假设属性,例如它们假定的高度非线性性质。我们基于线性的假设更简单,也可以解释为什么softmax回归容易受到对抗性示例的影响。


04

非线性模型的线性扰动 


设θ为模型的参数,x为模型的输入,y为与x相关的目标(对于有目标的机器学习任务),J(θ, x, y)为用于训练神经网络的成本。


我围绕θ的当前值线性化代价函数,得到最优的最大范数约束扰动


论文解读 | 解释和利用对抗性示例_线性模型_04

论文解读 | 解释和利用对抗性示例_正则化_05


实验证明了作者假设的对抗样本的产生原因是由于模型的线性特性。同时,这种算法也可作为一种加速对抗训练的方法。


05

线性模型与权重衰减的对抗性训练


考虑的最简单的模型是逻辑回归。在这种情况下,快速梯度符号法是精确的。我们可以用这个例子来直观地了解如何在一个简单的设置中生成对抗性示例。图示见图2。


如果我们训练一个单一模型来识别标签y∈{−1,1},P (y = 1) =

论文解读 | 解释和利用对抗性示例_神经网络_06

其中σ(z)为logistics型函数,则训练由梯度下降组成


论文解读 | 解释和利用对抗性示例_正则化_07

论文解读 | 解释和利用对抗性示例_正则化_08


06

深度网络的对抗性训练


通过对抗性和干净样例的混合训练,神经网络可以在一定程度上进行正则化。对抗性示例的训练与其他数据增强方案有所不同;通常,使用转换(例如预期在测试集中实际发生的翻译)来增加数据。这种形式的数据增强使用不太可能自然发生的输入,但暴露了模型概念化其决策函数的方式中的缺陷。当时,这个程序从未被证明可以在最先进的基准上提高辍学率。然而,这部分是因为很难对基于L-BFGS的昂贵对抗性示例进行广泛的实验。


我们发现基于快速梯度符号方法的对抗性目标函数训练是一种有效的正则化器:


论文解读 | 解释和利用对抗性示例_线性模型_09

论文解读 | 解释和利用对抗性示例_神经网络_10


07

对抗样本泛化原因

论文解读 | 解释和利用对抗性示例_神经网络_11


上图表明, 通过尝试不同的ϵ值,我们发现对抗性示例出现在由快速梯度符号方法定义的1-D子空间的连续区域中,而不是在局部极值附近。这解释了为什么对抗性示例如此普遍,以及为什么一个分类器错误分类的示例被另一个分类器错误分类的概率相当高。


为了解释多个分类器将相同类别分配给对抗性示例的现象,假设使用当前方法训练的神经网络类似于在相同训练集上训练的线性分类器。即使在不同子集上训练,这个基准分类器能够学习类似的分类权重,这是机器学习算法泛化的结果。这些底层分类权重的稳定性反过来导致对抗性示例的稳定性。



作者 | 不加糖

排版 | 春花

审核 | 柒柒


若您对该文章内容有任何疑问,请于我们联系,将及时回应,想获得更多第一资讯请关注微信公众号:智能机器人研究




标签:解读,训练,示例,模型,对抗性,神经网络,分类器
From: https://blog.51cto.com/bftrobot/7205593

相关文章

  • 论文解读(IW-Fit)《Better Fine-Tuning via Instance Weighting for Text Classificatio
    Note:[wechat:Y466551|可加勿骚扰,付费咨询]论文信息论文标题:BetterFine-TuningviaInstanceWeightingforTextClassification论文作者:论文来源:2021ACL论文地址:download 论文代码:download视屏讲解:click1介绍出发点:域适应一类方法是对预先训练好的模型参数进行微......
  • low-ui-vue前置解读|实现一个动态列的表格组件
    最近另一个团队正式在项目中推广内部开发的low-ui组件库了,当然还在内部阶段,但是太慢了。作为架子的设计者和部分功能的开发者,我决定先把常见的功能通过模仿的形式公开出来。避免大家搜索无果或者使用一些框架增加学习成本。所谓动态列的表格,就是列数不固定。像广为使用的elementU......
  • k8s挂载示例
    apiVersion:apps/v1kind:Deploymentmetadata:name:tongwebspec:selector:matchLabels:app:tongwebreplicas:1template:metadata:labels:app:tongwebspec:containers:-name:tongweb......
  • Python-OpenCV双目测距代码实现以及参数解读
    一、双目相机拍照后使用Matlab进行双目标定必看:USB双目相机的具体标定过程:https://blog.csdn.net/qq_40700822/article/details/124251201?spm=1001.2014.3001.5501主要参考:https://blog.csdn.net/dulingwen/article/details/98071584感谢大佬的分享!!!(*≧ω≦)!!二、标定后生成......
  • dockerfile netcore 示例
    #syntax=docker/dockerfile:1FROMmcr.microsoft.com/dotnet/sdk:7.0asbuild-envWORKDIR/appCOPY..RUNdotnetrestoreRUNdotnetpublish-cRelease-o/publishFROMmcr.microsoft.com/dotnet/aspnet:7.0asruntimeWORKDIR/srcCOPY--from=build......
  • 李飞飞VoxPoser论文解读
    VoxPoser:Composable3DValueMapsforRoboticManipulationwithLanguageModels论文:Huang,Wenlongetal.,VoxPoser:Composable3DValueMapsforRoboticManipulationwithLanguageModelshttps://voxposer.github.io/https://voxposer.github.io/voxposer.pdf......
  • java实现大文件上传示例
    ​ 一、功能性需求与非功能性需求要求操作便利,一次选择多个文件和文件夹进行上传;支持PC端全平台操作系统,Windows,Linux,Mac支持文件和文件夹的批量下载,断点续传。刷新页面后继续传输。关闭浏览器后保留进度信息。支持文件夹批量上传下载,服务器端保留文件夹层级结构,服务器端......
  • 用一个示例来学习DockerFile
    在Docker的世界里,我们经常会听到Dockerfile这个词。那么,什么是Dockerfile?它如何工作?本文将简要介绍Dockerfile的基本概念,原理以及一些常用的Dockerfile命令。什么是Dockerfile?Dockerfile是一个包含了一组命令的文本文件,这些命令可以被Docker解析并依此构建出一个新的Docker镜像......
  • 论文解读:《采用预训练蛋白嵌入贝叶斯神经网络,提高了药物蛋白的预测精度
    期刊:Bioinformatics中科院分区:1Q影像因子:6.937一、摘要动机:表征药物-蛋白质相互作用对于药物发现的高通量筛选至关重要。基于深度学习的方法引起了人们的关注,因为它们无需人工试错即可预测药物蛋白质相互作用。然而,由于数据标记需要大量资源,可用的蛋白质数据量相对较小,从而降低了模......
  • 期货核心竞争力在于解读供需背后的东西
    我们有理念有方法论。平衡表这个方法是2005年叶总他们摸出来的。原来你看平衡表是没感觉的,后来大家知道,平衡表我们要知道未来半年、未来一年商品的供需平衡情况。还要读懂这个平衡表,很多人是读不懂的,我们以前自己摸索的时候,其它基本不看,我们只是在会议室看这个东西。所有数据都是我......