首页 > 其他分享 >16-银行常见6种反欺诈手段

16-银行常见6种反欺诈手段

时间:2023-07-05 15:12:26浏览次数:41  
标签:欺诈 退货 16 种反 黑名单 监督 垃圾邮件 规则

16.银行6种常见的反欺诈手段

信贷业务是商业银行的主要利润来源,对整个银行的经营举足轻重。信贷业务下沉的同时,其风险也在不断扩张,基于新技术和新场景的欺诈形式和手段不断衍生,欺诈方式更具场景化、专业化、智能化。

 

16.1申请人真实性验证

常用的特征模块有面部识别、身份证二要素、银行卡三要素等。这一步基本上是一切互联网信贷行为的基础,只有确认了“你”是“你”,才会开展后续的业务。

16.2黑白名单

黑白名单是最原始的反欺诈手段,顾名思义,黑名单就是坏客户,白名单则指好客户。

举例:人行征信记录着每个信用卡持卡人的还款记录,如果你有信用卡逾期且拒绝还款,甚至直接从人间蒸发,你可能就上了人行的黑名单。一段时间后,你重新在江湖上复出,想着:申请新信用卡吧!银行在接到你的申请表后,在黑名单上一查,发现了你,于是乎,驳回!这就是黑名单的使用方式。

16.3规则引擎

黑名单的优缺点十分明显,优点就是简单方便,各行各业各产品的反欺诈都可以用黑名单,缺点是无法应对新出现的欺诈。黑名单的升级版本是规则引擎。

例如:你经常在淘宝上购买退货险,又屡屡退货,那么,你就有可能上了骗保的黑名单,想再次购买退货险就很难了。

举例:保险公司通过清单数据比对哪些人符合购买退货险的资质,经过一段时间的积累,保险公司发现,退货比例超过80%的用户极可能再次退货,疑似骗保;或者连续退货超过5次的用户的骗保嫌疑也非常大。于是乎,保险公司设定了一个阈值,规则如下:

(1)连续退货5次的用户,拒绝其购买退货险;

(2)退货比例超过80%,拒绝其再次购买退货险;

只要符合这两种规则的任何一个,其购买保险的交易就会被保险公司拒绝。这相比于黑名单,可以检测到部分新型欺诈者,增加了覆盖率。

但规则引擎却无法主动检测到新型欺诈模式。许多狡诈的欺诈分子会通过不断的测试规则,发现了规则的阈值。会将自己的退货率控制在79%以下, 继续骗取保费。一段时间后,保险公司再次发现了该模式,于是把阈值下调到50%。规则引擎通常可配合黑名单一起使用,通过规则引擎抓到的欺诈分子列到黑名单中。

但是规则引擎最大的问题在于只能依靠人为经验。这是一个十分耗费人力物力的过程,甚至还会出现经验错误而导致误判的状况。正因为经验的不确定性,规则通常需要投入大量的精力维护,不断更新、修改、删除添加等等,否则就会造成大量的假报和误报。

16.4有监督学习

有监督学习需要大量的有标签数据来训练模型,以此来预测还未被标注的数据。拿垃圾邮件举例,假设你把5000封已经由人工确认过的垃圾邮件输入到了模型,模型通过对标题的识别,对邮件内容句子的分割,关键词的识别等各种分析方法,找到了其中的内在关系,但却难以说明。

举例:

(1)标题里有“福利”二字的,有90%的可能性是垃圾邮件;

(2)内容里有“汇款账号:xxxxxx”的,有10%的可能性是垃圾邮件;

(3)一次性发送超过200封的,有60%的可能性是垃圾邮件;

(4)回复率低于10%的账户,有70%的可能性是垃圾邮件;

这里,百分比被称为权重。

当模型处理一封新的邮件,模型通过检测以上各个子项,并对每一个子项乘以权重后相加,就得出一个分数,得出:这封有80%的可能性是垃圾邮件。以上就是一个有监督学习抽象理解的过程,其中一个重要的步骤就是通过不断的迭代计算每一个子项应该被赋予的权重值。当权重值计算好后,就可以说这个模型训练好了。

有监督学习的好处也十分明显,它可以帮我们分析隐层关系。无需知道有监督学习的隐藏关系,每一个子项被赋予了多少权重,直接就知道符合某个规则的是坏客户。此外,有监督还有助于处理多维数据。由于规则是人凭经验产生了,当面对巨量的数据字段时,人显然是无法通过经验来直接操作的。此时,有监督就可以解决问题了。

但有监督也有一个明显的弊端,每一个模型都需要大量的训练数据,训练一个模型也需要较长的时间。常常出现你的模型还没有训练好,欺诈分子们就可能已经完成欺诈活动寻找下一个目标了。如此,有监督便无法应对复杂多变,诡计多端的欺诈者了。

16.5无监督学习

无监督学习反欺诈的主要方式有聚类和图形分析。无监督无需任何训练数据和标签,通过发现用户的共性行为,以及用户和用户的关系来检测欺诈。

有这样一群用户注册事件,通过聚类发现其几个小群符合某些共性:

例如:注册时间集中,都使用了某操作系统,某一个浏览器版本等。这个用户任何一个单独拿出来分析,看上去都是极其正常的用户,而如果其符合某种超乎寻常的一致性就十分可疑了。例如,一群人在凌晨2点-3点,采用chrome浏览器注册了某产品,其ip的前20位相同,GPS定位小于1公里,且注册后都去修改了昵称和性别。如果一个人这么做,问题不大。而如果一群人这么做显然就是不正常的。

无监督算法应用于反欺诈检测,通常还有一个优势,那就是提前预警。现在的欺诈分子都有潜伏期,以免太容易被发现。而由于其在潜伏期的行为依然符合某种规律,具有某些一致性,所以还是会被无监督算法捕捉到。

16.6网络图谱

一种思路是通过识别紧密关联的社群结构找出潜在的欺诈客群,常用的社会感知分析方法有Walktrap算法、InfoMap算法、FastGreedy算法等。

一般来说,识别欺诈团伙需要用到设备指纹,比如:设备关联多少个手机号,设备关联多少个身份证,手机关联多少个设备,IP是否是异常IP,登陆IP数等;

另一种思路是通过好坏用户的网络关系进行传播,可以使用标签传播算法(Label Propagation),传染病学模型(SIR Model), 以及概率图模型(MRF, CRF等)。比如团伙中有多少个逾期,一度联系人里面有多少个预期,二度联系人有多少预期,一度联系人里面黑名单数量,二度联系人黑名单数,团伙中是否命中黑中介。

标签:欺诈,退货,16,种反,黑名单,监督,垃圾邮件,规则
From: https://www.cnblogs.com/hole/p/17528591.html

相关文章

  • PowerDesigner反向导入表+PowerDesigner的ER图设计+PowerDesigner连接外键的线(版本16.
    使用PowerDesigner导入表+PowerDesigner画ER图+PowerDesigner设置外键ps:①ER图:就是PD中的PhysicalDiagram一、导入表,并设置备注为PD中的显示名称参考:https://blog.csdn.net/weixin_37530941/article/details/107331105利用建表语句sql导入表1、新建数据库模型2......
  • 【雕爷学编程】Arduino动手做(152)---BMI160 六轴陀螺仪模块
    37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的,这里准备逐一动手尝试系列实验,不管成功(程序走通)与否,都会记录下来—小小的进步或是搞......
  • 16净室软件工程
    净室软件工程是软件通过形式方法进行分析设计,并强调统计正确性验证替代测试的方法来交付软件,为了避免人为的错误。技术手段有:控制迭代:统计过程控制下的增量式开发盒子结构:黑盒、状态盒、明盒。行为视图、有限状态机视图、过程视图正确性验证:净室工程的核心统计测试和软件认证......
  • vue项目报错:Node.js v18.16.1 error Command failed with exit code 1.
    原因:把node升级到了最新的长期支持版18.16.1,结果运行vue项目启动失败,报错如下:试了各种办法都解决不了,后面只能把node降级到16.20.1运行项目又可以启动了......
  • 1633. 各赛事的用户注册率
    1633.各赛事的用户注册率SQL架构用户表: Users+-------------+---------+|ColumnName|Type|+-------------+---------+|user_id|int||user_name|varchar|+-------------+---------+user_id是该表的主键。该表中的每行包括用户ID和用户......
  • 16-4linux启动流程和grub管理 16-5()16-6()
    一、修复grub1.esc进入救援模式  根目录需要进入真正的根ls/mnt/sysimage/boot/grubchroot/mnt/sysimage切换到真正的根grub-install/dev/sda2修复命令,只能修改除了grbu.conf配置文件意外的文件hexdump-C-n512/dev/sda-v查看是否修复2.修复grub.conf文......
  • api接口技术开发心得,获取1688淘宝商品详情数据,数据采集调用教程
    ​ 商品详情API接口的作用和重要性主要体现在以下几个方面:获取详细商品信息:商品详情API接口提供了获取1688和淘宝商品的完整详细信息的功能。这包括商品名称、价格、库存、规格、描述、图片、运费等。这些详细信息对于用户来说是购买决策的重要依据。提供用户购物体验:通......
  • AtCoder Regular Contest 163
    Preface补题,这场比赛的时候被拉去开科研组会了,所以就没现场打了这两天军训在伤病连划水,白天可以好好想题目舒服的一批这场D题确实很妙,需要一些竞赛图相关的知识才能想到转化,不过也算是学到一个重要trick了吧A-DivideString显然只要考虑能否分成两个串即可,首先如果存在\(i......
  • 16-1 文件处理三剑客置awk基本用法 16-2()16-3()
    一、awk BEGIN[root@centos8~]#awk'BEGIN{print"hello,awk"}'[root@centos8~]#awk-F:'{print$1":"$3}'/etc/passwd[root@centos8~]#df|awk-F"[[:space:]]+|%"'{print$5}'|sort-nr|head-n......
  • 第016课 Nand Flash操作原理及裸机程序分析
    第001节_NAND_FLASH操作原理NANDFLASH原理图NANDFLASH是一个存储芯片那么:这样的操作很合理”读地址A的数据,把数据B写到地址A”问1.原理图上NANDFLASH和S3C2440之间只有数据线,怎么传输地址?答1.在DATA0~DATA7上既传输数据,又传输地址当ALE为高电平时传输的是地址,那么在数据......