首页 > 其他分享 >Black-Box Attack-Based Security Evaluation Framework forCredit Card Fraud Detection Models

Black-Box Attack-Based Security Evaluation Framework forCredit Card Fraud Detection Models

时间:2023-09-23 19:11:25浏览次数:48  
标签:Box Fraud Based 攻击 模型 样本 算法 黑盒 SVM

Black-Box Attack-Based Security Evaluation Framework forCredit Card Fraud Detection Models

动机

AI模型容易受到对抗性攻击(对样本添加精心设计的扰动生成对抗性示例)

现有的对抗性攻击可以分为白盒攻击和黑盒攻击。

白盒攻击:攻击者可以访问有关目标模型的所有信息,包括训练集、类型、结构和参数。

黑盒攻击:只知道给定输入样本的输出。

其中黑盒模型可以分为三类:迁移、分数、决策。

黑盒攻击所需的信息更少,更难以实现。但是一旦实现了较好的黑盒攻击,将会使得银行和个人更加难以察觉盗刷、进而造成更大的损失。

一方面,难以确认现有算法在面对黑盒攻击时是否存在风险。另一方面,现有的黑盒算法来评估模型的安全性也并不容易,因为既不能直接得到预测分数,又会需要对模型进行大量的查询。没有分数,基于分数和决策的黑盒算法直接失效,而大量的测试会影响效率,也会增加被抓的风险,基于迁移的算法也难以实现。

因此,文章的目标是设计一种不需要大量查询的迁移算法,实现更强大的攻击模型。

模型

img
这个流程图画得挺乱的。

模型的流程:

  1. 银行使用训练集\(D_{tr}\)和验证集\(D_{va}\)训练和优化目标模型O

  2. 欺诈者随机选择\(\tau\)个训练集中的数据,并只保留\(\beta\)个特征,得到样本集\(D'_{tr}\),从中选取\(\delta\)个样本使用O得到标签\(L\),其余得构成无标签数据集\(U\),再使用半监督学习模型对\(U\)进行选择性标记,增强\(L\)得到增强数据集\(L_{aug}\)

  3. 使用\(L_{aug}\)训练替代模型\(C\),文章尝试了Linear-SVM和RBF-SVM两种替代模型。

  4. 基于替代模型\(C\)生成对抗样本集\(D_{adv}\),使用改进的非线性优化模型求解生成每个正样本的对抗样本。

  5. 评估O的安全性。在不同攻击强度\(p\)下计算O在\(D_{adv}\)上的分类准确率Acc(p),以及模型的安全性SEI

细节

对于第1步

文章使用了8种不同的模型训练O:LR(逻辑回归),DT(决策树),Linear-SVM,RBF-SVM,XGBoost,DNN,IF无监督异常检测算法,DAE无监督深度神经网络

对于第2步

半监督算法有两种:Co-Forest,先监督训练,再用得到的模型预测补充更多标签并迭代;FlexMatch(NIPS 21),比起前者,会从0开始动态提高预测阈值,让模型不偏科、提高数据利用率。

对于第4步

使用测试集\(D_{te}\)中的正样本(欺诈)x构建优化问题:

\[x^* = arg \min_{x}\hat{g}(x) \]

其中\(x^+\)是原始的欺诈样本,\(x\)是调整后的样本(调整中的中间变量),

\(\hat{g}=\omega^T\phi(x)+b=\sum^N_{i=1}\alpha_i y_i K(x_i, x) + b\),

这里的\(\alpha_i \geq 0\)是拉格朗日乘子,\(K(\cdot)\)是核函数,如线性核函数\(K(x_i, x) = x_i^Tx\)以及RBF核\(E^{-\gamma ||x_i-x||^2}\)等。

给该函数限制一个最大值\(d(x^+, x) \leq p\),是在限制生成的正样本和修改之后的样本之间的最大距离。

当模型为Linear-SVM时,该问题有最优解:

\[x^*=x^+-\frac{p}{\sqrt{\omega^T\omega}}\omega, \]

而当使用RBF-SVM时需要借助顺序最小二乘编程法数值求解上述优化问题。得到的\(x^*\)作为对应的对抗样本,构成最终的对抗样本集\(D_{adv}\)

对于第5步

\[Acc(p) = \frac{N_p}{|D_{adv}|} \]

\[SEI \approx \frac{1}{2p_{max}}\sum^{t-1}_{i=1}(p_{i+1}-p_i) \cdot (Acc(p_{i+1})+Acc(p_i)) \]

算法伪代码

img
img

这里的13行应该位置错了,要调到第8行前。

实验

文中说了之前没有黑盒算法的安全评估算法,所以就只是用了传统的Linear和RBF作为baseline

img

img

img

img

标签:Box,Fraud,Based,攻击,模型,样本,算法,黑盒,SVM
From: https://www.cnblogs.com/yujianke100/p/17724926.html

相关文章

  • Qt之QMessageBox的用法
    一、QMessageBox::informationQMessageBox::information 用于创建一个信息对话框,通常用于向用户显示一些重要的信息或通知。这个函数的用法很简单,它接受几个参数来配置对话框的内容和行为,并且通常以模态方式显示对话框,阻塞程序的执行,直到用户关闭对话框。QMessageBox::informa......
  • VirtualBox 安装 Ubuntu
    VirtualBox安装Ubuntu这里我们就以安装虚拟机的方式在我们的电脑上安装Linux操作系统,我们选用Ubuntu作为教程,如果有经济实力,可以在腾讯云、阿里云之类的服务商购买一台云服务器,并选择预装Ubuntu系统;如果你还想搞嵌入式开发之类的工作,可以购买一台树莓派服务器,也可以在上面安装U......
  • element ui 的messageBox中绑定vnode节点
    <template><divclass="about"><h1>Thisisanaboutpage</h1><el-buttontype="primary"size="default"@click="onTest">测试</el-button><div></div&......
  • 【WPF】PasswordBox汇总
    一、回车事件写法1:绑定:TextPassWord.KeyDown+=TextPassWord_KeyDown;privatevoidTextPassWord_KeyDown(objectsender,KeyEventArgse){if(e.Key==Key.Enter){TextErr.Text=null;......
  • python,一个数组y1存放yolo的位置信息BBOX,一个y2数组存放识别的结果信息,根据y1数组按
    importnumpyasnp#示例数据y1=np.array([[50,100,200,300],[10,20,30,40],[60,70,80,90]])y2=np.array(['cat','dog','bird'])#按左上角点的坐标排序y1数组sorted_indices=np.lexsort((y1[:,1],y1[:,0]))y1_sorted=y1[sorted......
  • JS实现table动态生成过程中,移动行checkbox值丢失问题的解决
     最近在做项目过程中遇到这样一个疑问:(查看实例代码TEST1)DHTML中table对象的moveRow方法实现对table中表格行移动到新位置。例子TEST1中行2包含文本框、复选框、下拉框,当分别键入值后对行2执行上移操作后,我们发现,文本框与下拉框的值不会丢失,但复选框值会丢失。而如果在行2中键......
  • HBase_API_(HBaseDML,对数据的api)
    对表中数据进行以下操作:静态属性1.插入数据2.读取数据3.扫描数据4.5.HBaseConnection.java(提供connection连接)packagecom.atguigu;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.client.Connection;importorg.apache.hadoop.h......
  • HBase_API_(HBaseDDL,对表的api)
    对hbase数据表进行以下操作:1.创建命名空间2.判断表是否存在3.创建表格4.修改表格5.删除表格注意:对表格的操作要调用admin,对数据进行操作调用table(这篇博客没有涉及到)packagecom.atguigu;importorg.apache.hadoop.hbase.NamespaceDescriptor;importorg.apache.hadoop......
  • sandboxie 穿透多开读写
    下午想了想,然后实操了一下sandboxie基础上,只要100行代码就可以实现穿透多开读写。dirc:\123其实是两个目录的合集,且不在沙盒内......
  • [IJCAI 2023]Fighting against Organized Fraudsters Using Risk Diffusion-based Par
    [IJCAI2023]FightingagainstOrganizedFraudstersUsingRiskDiffusion-basedParallelGraphNeuralNetwork文章设计了一种基于社区的医疗保险欺诈行为检测。模型为了提高精度,模型设计了一组异构图模型和一组同构图模型。输入的异构图是保险受益人-医疗服务提供者的图,......