首页 > 其他分享 >互联网风控揭秘:打造核心指标体系

互联网风控揭秘:打造核心指标体系

时间:2024-03-12 23:00:12浏览次数:24  
标签:指标 好人 指标体系 坏人 黑产 90% 风控 揭秘

一、互联网业务风控的业务范围

风控其实是一个很大的概念,"风控入门指南"系列文章,关注互联网业务风控。
具体包括,账号风控、营销反作弊、支付风控、广告反作弊、内容风控等场景的风险管控。
各场景风险项如下:

风险场景风险类型
账号风控批量注册、晒号、养号、撞库
营销反作弊薅羊毛
支付风控盗卡、盗刷、洗钱
广告反作弊展示作弊、刷量作弊、归因作弊
内容风控涉恐、涉政、垃圾消息等

二、风控的目标是什么

马克思曾经说过:"一旦有适当的利润,资本就胆大起来。如果有10%的利润,它就保证到处被使用;有20%的利润,它就活跃起来;有50%的利润,它就铤而走险;为了100%的利润,它就敢践踏一切人间法律;有300%的利润,它就敢犯任何罪行,甚至冒绞首的危险。"

黑产的利润远不止300%,只要有足够的利润,黑产就会像野草一样,春风吹又生。所以,风控的目标从来不是消灭黑产,我们要做的,是不断提高黑产作恶的成本,当成本>收益,黑产自然会放弃或者转换目标。 杀头的买卖有人干,亏本的买卖没人做,是永恒的真理。

三、风险量化:寻找你的北极星指标

就像我们一定要有一个损失函数,才能度量贪婪搜索是否在往正确的方向优化,风控也需要有北极星指标来指引策略优化。
If you can't measure it, you can't improve it!

准召类指标

假设目标是找到坏人,即正样本是坏人。
传统机器学习衡量二分类模型的指标有准确率(Accuracy)、精度(Precision)、召回率(Recall), 计算公式如下:

预测坏人预测好人
实际坏人AB
实际好人CD

准确率(Accuracy)= (A+D)/(A+B+C+D),即预测结果正确的比例。
精 度(Precision) = A/(A+C) ,即预测的100个坏人里面,到底有多少是真坏人。
召回率(Recall) = A/(A+B) ,即实际有100个坏人的话,你覆盖了多少。
精度和准确率工业界经常混用,平时一定要问清楚具体计算方式。

以上指标,对于不平衡类问题会有失真的问题:
比如在薅羊毛场景,经常90%以上流量是坏人利用自动机产生的。

预测坏人预测好人
实际坏人900
实际好人100

当模型全部预测为坏人的时候,以上指标依然都大于90%。 准确率(Accuracy)= 90% 精 度(Precision) =90% 召回率(Recall) =100%

实际风控业务上,我们主要实用基于混淆矩阵调整以后的误伤和覆盖指标:
好人误伤率 = D/(C+D) = 0% ,即好人里面实际误伤了多少。
恶意覆盖率 = A/(A+B) = 90% ,即坏人里面实际打击到了多少。
一般情况,优化方向是在保证好人误伤率<××%的前提下,提升恶意覆盖率。

准召类指标存在一些缺点:

  • 好人样本或者坏人样本有时间非常难获取,造成难以评估或者评估方法无法令人信服。

  • 指标和业务缺乏关联,适用于平台型风控,不适合业务部门风控。

提升度指标

这里的提升度并不是指关联规则挖掘里面的提升度(Lift),而是指策略加入前后的效果提升类指标。

  • 比如注册场景,打击之前抽样好人占比20%,打击以后抽样好人占比90%,那好人提升度可以是 90%/20% = 4.5,即好人占比基于大盘提升了4.5倍。

  • 比如广告场景,放过部分的转化率5%,打击部分的转化率1%,证明策略有效的提升度指标可以是 5%/1% = 5,即我们打击的坏人流量和好人流量在转化率上有5倍的区分度。
    提升度指标是业务初期的好选择之一,只要找到的流量和大盘区分度足够明显,就可以用类似指标证明风控价值。

资损

止损金额在营销反作弊、支付反作弊等涉及到钱的场景是非常好的虚荣指标。 好处是:

  • 指标易于理解:方便和业务经营指标联系起来,争取业务领导的关注。

  • 指标计算简单:只用对拦截进行汇总即可。相比准召的人工抽样等方法,计算快,人力投入少。

四、写在最后

"书足以记名姓而已。剑一人敌,不足学,学万人敌。"

高级的风控,在我看来,应该是能看清楚行业大势的。

  • 这个行业价值多少,黑产获利空间多少,推算黑产从业人员有多少。

  • 产业链怎样配合,有哪些自动化工具,变动趋势是怎样的。

  • 为什么我们要在这个方向是投入人力,不投入风险敞口有多少。

从更高的角度去看行业变化、利益变化才是高级的风控。

标签:指标,好人,指标体系,坏人,黑产,90%,风控,揭秘
From: https://blog.csdn.net/qq_25243447/article/details/136665585

相关文章

  • JAVA系统源码中的AI智能绘画生成技术揭秘
    在数字化时代,人工智能(AI)已经逐渐渗透到我们生活的方方面面,从智能语音助手到自动驾驶汽车,无不体现出AI技术的强大魅力。而在艺术领域,AI同样展现出了惊人的创造力。近期,一项融入JAVA系统源码的AI智能绘画生成技术引起了广泛关注。这项技术究竟有何神奇之处?让我们一起来揭秘。一......
  • 揭秘Docker镜像:概念、原理、特性的全方位解读与实战常用命令解析
    在当今的云原生时代,Docker凭借其轻量级容器技术彻底改变了软件交付和部署的方式。而Docker镜像作为容器的基石,其背后的奥秘和实际应用更是值得我们深入探讨。本文将全面解析Docker镜像的概念、底层原理、独特特性以及日常运维中常用的命令,让您对Docker镜像有更深层次的理解与掌......
  • 揭秘Google Gemini:AI界的多模态革命者与ChatGPT-4的较量
    在人工智能的快速发展浪潮中,GoogleDeepMind的最新力作——Gemini,以其多模态的超凡能力,正引领着AI技术的新一轮革命。本文将深入探讨Gemini的核心特性、不同版本的特点,以及它与ChatGPT-4的对比优势和差异。一、Gemini简介AI的新纪元GoogleGemini,作为DeepMind的旗舰产......
  • RC4Drop算法的工作原理揭秘:加密技术的进步之路
    RC4Drop算法起源:RC4Drop算法是RC4算法的一种改进版本,旨在解决RC4算法在长时间加密过程中可能出现的密钥流偏置问题。RC4算法由RonRivest于1987年设计,是一种流密码算法,而RC4Drop算法则在此基础上加入了丢弃密钥字节的步骤,以增强安全性和随机性。RC4Drop加密解密|一个覆盖......
  • HTML常用字体标签:揭秘HTML字体标签,让你的网页“字”得其乐!
    在数字世界的构建中,字体不仅仅是文字的外衣,更是情感和风格的传递者。作为网页设计师和前端开发者,掌握HTML中的字体标签,能够让我们创造出更加丰富和吸引人的用户体验。今天,就让我们一起走进HTML字体标签的世界,探索它们如何让网页变得生动有趣。一、认识基本字体标签语法结构:<标......
  • 房地产渠道风控怎么开展
     房地产渠道风控是一套综合性的管理策略,它主要通过对销售渠道的各个环节进行风险评估、监控和管理,来确保企业的稳健运营和利益最大化。这种风控不仅涉及对销售渠道本身的管理,还涵盖了对合作伙伴、客户信用、市场波动等多个方面的考量。房地产渠道风控的作用主要体现在以下几个......
  • 揭秘ChatGPT:改变你聊天方式的秘密武器
    ​世界上最受关注的对话伙伴是谁?在今天的时代,答案毫无疑问是ChatGPT。ChatGPT是一款由美国OpenAI公司开发的智能对话程序,只需简单的用户注册,就可以与这款全球参数规模最大的AI机器人进行互动。ChatGPT的能力远超常规的搜索引擎或问答机器人,它不仅能回答你的基础问题,更有创作才......
  • 【深度解析】'go build'缓存机制:揭秘Windows下缓慢的原因
    引言本文主要围绕gobuild的缓存hash计算与获取缓存文件来编写。  笔者是Windows系统用户,在gobuild或golist-export一些需要编译(但已存在编译缓存)场景下执行的很慢。网上有很多说法大多都是说关闭杀毒软件、关闭磁盘扫描等,并未清楚的描述为什么。  接下来我将围绕g......
  • 揭秘阿里巴巴:如何通过API实时捕获中国市场商品数据
    阿里巴巴提供了丰富的API接口,使得第三方开发者可以实时捕获中国市场商品数据。以下是一些关键步骤和要点,帮助你揭秘如何通过阿里巴巴的API实现这一目标:注册并登录阿里巴巴开放平台:首先,你需要在阿里巴巴开放平台注册一个账号,并登录到开发者中心。这一步是获取API使用权限的基础,......
  • 工作两年涨薪40%,揭秘我的学习之路!
    毕业出来工作差不多两年了,就呆过一家公司,主要做功能测试,会自己驱动做些自动化相关的工作,但不想就此止步,所以换了工作,最近刚获得了新Offer,涨薪幅度40%+,年薪大概25w。自己还挺满意的,不论薪资还是福利方面,希望未来能持续进步,不断成长。关于之前的工作我是从大二开始接触并学习......