互联网风控揭秘：打造核心指标体系

时间：2024-03-12 23:00:12浏览次数：26

一、互联网业务风控的业务范围

风控其实是一个很大的概念，"风控入门指南"系列文章，关注互联网业务风控。
具体包括，账号风控、营销反作弊、支付风控、广告反作弊、内容风控等场景的风险管控。
各场景风险项如下：

风险场景	风险类型
账号风控	批量注册、晒号、养号、撞库
营销反作弊	薅羊毛
支付风控	盗卡、盗刷、洗钱
广告反作弊	展示作弊、刷量作弊、归因作弊
内容风控	涉恐、涉政、垃圾消息等

二、风控的目标是什么

马克思曾经说过："一旦有适当的利润，资本就胆大起来。如果有10%的利润，它就保证到处被使用；有20%的利润，它就活跃起来；有50%的利润，它就铤而走险；为了100%的利润，它就敢践踏一切人间法律；有300%的利润，它就敢犯任何罪行，甚至冒绞首的危险。"

黑产的利润远不止300%，只要有足够的利润，黑产就会像野草一样，春风吹又生。所以，风控的目标从来不是消灭黑产，我们要做的，是不断提高黑产作恶的成本，当成本>收益，黑产自然会放弃或者转换目标。 杀头的买卖有人干，亏本的买卖没人做，是永恒的真理。

三、风险量化：寻找你的北极星指标

就像我们一定要有一个损失函数，才能度量贪婪搜索是否在往正确的方向优化，风控也需要有北极星指标来指引策略优化。
If you can't measure it, you can't improve it!

准召类指标

假设目标是找到坏人，即正样本是坏人。
传统机器学习衡量二分类模型的指标有准确率（Accuracy）、精度（Precision）、召回率（Recall），计算公式如下：

	预测坏人	预测好人
实际坏人	A	B
实际好人	C	D

准确率（Accuracy）= (A+D)/(A+B+C+D)，即预测结果正确的比例。
精度（Precision） = A/(A+C) ，即预测的100个坏人里面，到底有多少是真坏人。
召回率（Recall） = A/(A+B) ，即实际有100个坏人的话，你覆盖了多少。
精度和准确率工业界经常混用，平时一定要问清楚具体计算方式。

以上指标，对于不平衡类问题会有失真的问题：
比如在薅羊毛场景，经常90%以上流量是坏人利用自动机产生的。

	预测坏人	预测好人
实际坏人	90	0
实际好人	10	0

当模型全部预测为坏人的时候，以上指标依然都大于90%。准确率（Accuracy）= 90% 精度（Precision） =90% 召回率（Recall） =100%

实际风控业务上，我们主要实用基于混淆矩阵调整以后的误伤和覆盖指标:
好人误伤率 = D/（C+D） = 0% ，即好人里面实际误伤了多少。
恶意覆盖率 = A/（A+B） = 90% ，即坏人里面实际打击到了多少。
一般情况，优化方向是在保证好人误伤率<××%的前提下，提升恶意覆盖率。

准召类指标存在一些缺点：

好人样本或者坏人样本有时间非常难获取，造成难以评估或者评估方法无法令人信服。
指标和业务缺乏关联，适用于平台型风控，不适合业务部门风控。

提升度指标

这里的提升度并不是指关联规则挖掘里面的提升度（Lift），而是指策略加入前后的效果提升类指标。

比如注册场景，打击之前抽样好人占比20%，打击以后抽样好人占比90%，那好人提升度可以是 90%/20% = 4.5，即好人占比基于大盘提升了4.5倍。
比如广告场景，放过部分的转化率5%，打击部分的转化率1%，证明策略有效的提升度指标可以是 5%/1% = 5，即我们打击的坏人流量和好人流量在转化率上有5倍的区分度。
提升度指标是业务初期的好选择之一，只要找到的流量和大盘区分度足够明显，就可以用类似指标证明风控价值。

资损

止损金额在营销反作弊、支付反作弊等涉及到钱的场景是非常好的虚荣指标。好处是：

指标易于理解：方便和业务经营指标联系起来，争取业务领导的关注。
指标计算简单：只用对拦截进行汇总即可。相比准召的人工抽样等方法，计算快，人力投入少。

四、写在最后

"书足以记名姓而已。剑一人敌，不足学，学万人敌。"

高级的风控，在我看来，应该是能看清楚行业大势的。

这个行业价值多少，黑产获利空间多少，推算黑产从业人员有多少。
产业链怎样配合，有哪些自动化工具，变动趋势是怎样的。
为什么我们要在这个方向是投入人力，不投入风险敞口有多少。

从更高的角度去看行业变化、利益变化才是高级的风控。

标签：指标,好人,指标体系,坏人,黑产,90%,风控,揭秘
From： https://blog.csdn.net/qq_25243447/article/details/136665585

JAVA系统源码中的AI智能绘画生成技术揭秘
在数字化时代，人工智能（AI）已经逐渐渗透到我们生活的方方面面，从智能语音助手到自动驾驶汽车，无不体现出AI技术的强大魅力。而在艺术领域，AI同样展现出了惊人的创造力。近期，一项融入JAVA系统源码的AI智能绘画生成技术引起了广泛关注。这项技术究竟有何神奇之处？让我们一起来揭秘。一......
揭秘Docker镜像：概念、原理、特性的全方位解读与实战常用命令解析
在当今的云原生时代，Docker凭借其轻量级容器技术彻底改变了软件交付和部署的方式。而Docker镜像作为容器的基石，其背后的奥秘和实际应用更是值得我们深入探讨。本文将全面解析Docker镜像的概念、底层原理、独特特性以及日常运维中常用的命令，让您对Docker镜像有更深层次的理解与掌......
揭秘Google Gemini：AI界的多模态革命者与ChatGPT-4的较量
在人工智能的快速发展浪潮中，GoogleDeepMind的最新力作——Gemini，以其多模态的超凡能力，正引领着AI技术的新一轮革命。本文将深入探讨Gemini的核心特性、不同版本的特点，以及它与ChatGPT-4的对比优势和差异。一、Gemini简介AI的新纪元GoogleGemini，作为DeepMind的旗舰产......
RC4Drop算法的工作原理揭秘：加密技术的进步之路
RC4Drop算法起源：RC4Drop算法是RC4算法的一种改进版本，旨在解决RC4算法在长时间加密过程中可能出现的密钥流偏置问题。RC4算法由RonRivest于1987年设计，是一种流密码算法，而RC4Drop算法则在此基础上加入了丢弃密钥字节的步骤，以增强安全性和随机性。RC4Drop加密解密|一个覆盖......
HTML常用字体标签：揭秘HTML字体标签，让你的网页“字”得其乐！
在数字世界的构建中，字体不仅仅是文字的外衣，更是情感和风格的传递者。作为网页设计师和前端开发者，掌握HTML中的字体标签，能够让我们创造出更加丰富和吸引人的用户体验。今天，就让我们一起走进HTML字体标签的世界，探索它们如何让网页变得生动有趣。一、认识基本字体标签语法结构：<标......
房地产渠道风控怎么开展
房地产渠道风控是一套综合性的管理策略，它主要通过对销售渠道的各个环节进行风险评估、监控和管理，来确保企业的稳健运营和利益最大化。这种风控不仅涉及对销售渠道本身的管理，还涵盖了对合作伙伴、客户信用、市场波动等多个方面的考量。房地产渠道风控的作用主要体现在以下几个......
揭秘ChatGPT：改变你聊天方式的秘密武器
世界上最受关注的对话伙伴是谁？在今天的时代，答案毫无疑问是ChatGPT。ChatGPT是一款由美国OpenAI公司开发的智能对话程序，只需简单的用户注册，就可以与这款全球参数规模最大的AI机器人进行互动。ChatGPT的能力远超常规的搜索引擎或问答机器人，它不仅能回答你的基础问题，更有创作才......
【深度解析】'go build'缓存机制：揭秘Windows下缓慢的原因
引言本文主要围绕gobuild的缓存hash计算与获取缓存文件来编写。笔者是Windows系统用户，在gobuild或golist-export一些需要编译（但已存在编译缓存）场景下执行的很慢。网上有很多说法大多都是说关闭杀毒软件、关闭磁盘扫描等，并未清楚的描述为什么。接下来我将围绕g......
揭秘阿里巴巴：如何通过API实时捕获中国市场商品数据
阿里巴巴提供了丰富的API接口，使得第三方开发者可以实时捕获中国市场商品数据。以下是一些关键步骤和要点，帮助你揭秘如何通过阿里巴巴的API实现这一目标：注册并登录阿里巴巴开放平台：首先，你需要在阿里巴巴开放平台注册一个账号，并登录到开发者中心。这一步是获取API使用权限的基础，......
工作两年涨薪40%，揭秘我的学习之路！
毕业出来工作差不多两年了，就呆过一家公司，主要做功能测试，会自己驱动做些自动化相关的工作，但不想就此止步，所以换了工作，最近刚获得了新Offer，涨薪幅度40%+，年薪大概25w。自己还挺满意的，不论薪资还是福利方面，希望未来能持续进步，不断成长。关于之前的工作我是从大二开始接触并学习......