风控模型指标全解：KS、LIFT、GINI等

时间：2023-05-09 16:47:16浏览次数：70

标签：GINI 模型样本 prop KS bad LIFT 风控

Gini
KS值
LIFT提升度
参考资料

实习接触到的数据大多来自于金融公司，这类模型关注风险，目的是降低风险而使得在风险和收益的博弈中最大化利润。模型评价指标不局限于准确率等常规指标，往往引入了更复杂的指标衡量模型的效果。以下介绍风控场景下常见的模型评价指标。

数据含义

模型处理的数据是客户的身份信息（性别、年龄、教育程度等）、存款情况、交易行为等信息。原始数据标签一般为二分类，其中0代表好客户，1代表坏客户。建模时最常用到逻辑回归，模型预测这个客户是坏的概率（如表示信用不良、贷款逾期等）。

风控场景下关注的模型指标包括但不限于以下表格：

其中统计学/机器学习中通用的概念，如混淆矩阵、AUC，ROC等不再赘述。

Gini

KS值

定义：
KS全称Kolmogorov-Smirnov，是信用评分和其他很多学科中常见的统计量，用于衡量模型对正负样本的区分度。KS值为累计坏人占比与累计好人占比的差值绝对值的最大值。

KS检验：比较频率分布f(x)与理论分布g(x)或两个观测值分布的是否一致检验方法，原假设两个数据分布一致或数据符合理论分布，统计量D=max|f(x)−g(x)|。

计算方式：

与ROC曲线类似，我们可以将累计坏人占比与累计好人看作不同阈值下的TPR和FPR，则

\[KS = \max(TPR-FPR) \]

取值说明：

KS<0.2 模型的区分能力不高，价值不大；
0.2<=KS<0.4 一般金融机构开发的评分模型KS大部分都集中在这个区间内，模型具备一定的区分能力和使用价值，此时可以结合其他指标继续观察调优模型；
0.4<=KS<=0.7 模型区分能力比较好，模型有应用价值；
KS>0.7 模型好的难以令人置信，可能在变量中加入了业务目标衍生指标，需要对模型特征工程进行排查。

根据KS，可以选择对应阈值作为分界，最大化过滤坏人比例。

LIFT提升度

定义：

模型对坏样本的预测能力相比随机选择的倍数，当LIFT>1则说明模型表现优于随机选择。

计算方式：

将样本划分多个桶/组/区间，计算每个区间内样本的坏样本率与整体坏样本率的比值。

通常将模型的输出信用评分以bucket=10相等分位数（quantile）分箱，按照从低到高排序（违约概率从高到低），计算累计坏样本占比与累计总样本占比的比值。如下表，其中

%Bad = 当前行#Bad / sum(#Bad)
%CumBad = 上一行%Bad + 上一行%CumBad
LIFT = %Bad / %CumBad

第一行 LIFT=4.1013表示，我们使用这个模型相比随机选择对坏样本的预测能力提升的倍数。比如对于金融应用中的贷款场景，如果直接不加筛选，10000人中可能遇到100个坏客户；我们选择大于655信用分作为放贷条件阈值，则模型选择的10000个客户中可能只有60个坏客户。模型虽然不能完全过滤全部坏客户，但能坏客户的比例，从而降低风险。

以toad库提供的KS_bucket函数为例：

该函数实现的源码可见toad/metrics.py，从源码上可以看到，计算lift使用

agg2['lift'] = agg2['bad_prop'] / agg2['total_prop']，即下表中 bad_prop 与 total_prop 比值。与前面定义稍有不同，计算的bad_prop并不是累计值，因此得到的lift为每一组内的提升值。其中

bad_rate = 每一组bads / 每一组总数
odds = 每一组bads / 每一组goods

bad_prop = 每一组bads / 所有bads总数
lift = bad_prop / total_prop(每一组总数占全部比例)

而 cum_lift 的结果与上面的定义一致。

reverse_suffix = '_rev' (或为空，根据ks调整)
agg2['cum_lift'] = agg2['cum_bads_prop' + reverse_suffix] / agg2['cum_total_prop' + reverse_suffix]

参考资料

指标表格：风控领域常用评估指标：ROC/AUC、KS、Gain、Lift等 - penny618 - 博客园 (cnblogs.com)

KS：风控模型评估指标介绍（KS、AUC & Gini） - 知乎 (zhihu.com)

LIFT：怎么做模型提升度的曲线？ - 知乎 (zhihu.com)

标签：GINI,模型,样本,prop,KS,bad,LIFT,风控
From： https://www.cnblogs.com/izcat/p/17385504.html

vCenter Server 8.0U1 OVF：在 Fusion 和 Workstation 中快速部署 vCSA
vCenterServer8.0U1系列更新请访问原文链接：https://sysin.org/blog/vmware-vcenter-8-ovf/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.org新的IA/GA模型vSphere8版本发布转向了新的IA/GA（初始可用性/通用可用性）模型。发布周期如下：所有主要和更新的vSpher......
解决银河麒麟V10系统Failed to download metadata for repo ‘ks10-adv-os‘报错问题
原文链接：https://blog.csdn.net/m0_53967669/article/details/127283289在使用银河麒麟系统时会时不时的安装程序，yum命令是最方便快捷的命令，但是在使用的过程中出现了Failedtodownloadmetadataforrepo'ks10-adv-os’这样的报错如何解决呢？经过了多次的尝试，小编终于成功解决，......
[PLC]三菱FX5U WORKS3中使用特殊继电器/特殊寄存器注释显示
1.菜单栏"视图"-->"多个注释"-->"注释读取"2.勾选如图所示:3.点击确定,例如sm412这种特殊继电器/特殊寄存器就会自动显示注释.......
缺少Jackson jar包,导致对象无法转化为json数据输出
用于Json的序列化(serialization)和反序列化(deserialization)。Jackson包含三个包jackson-core、jackson-annotation、jackson-databind，作用如下 <dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-databind</a......
kingbase之ksql命令工具
原文链接：https://blog.csdn.net/carefree2005/article/details/127508686一、ksql命令工具简介 ksql是人大金仓提供给DBA的与KES数据库交互的命令行客户端程序。熟练使用ksql工具可以帮助DBA快速的操作和维护数据库。博文实验环境：操作系统：centos7.6kingbase版本：V008R006C006B......
1163 Dijkstra Sequence + 层序遍历 + 链式前向星
PAT题目链接：https://pintia.cn/problem-sets/994805342720868352/exam/problems/1478635670373253120这题踩了太多坑，本来没什么内容，硬是断断续续查了三天的bug：第一天：循环的时候内部判断逻辑不要写在for循环里，否则本该continue的逻辑，硬生生变成了break。我真是脑袋瓜秀逗了才会......
分析游戏中的金钱交易：Multi-view Attention Networks
文章目录1.摘要2.引入3.游戏数据描述3.1逆水寒中的游戏日志3.2社交图分析3.3行为序列3.4角色属性构造4.MVAN模型4.1multi-graphattentionnetwork4.2behaviourattentionnetwork4.3behaviourattentionnetwork4.4DataSourceAttentionNetwork5.模型效果5.1baseline......
基于 EKS Fargate 搭建微服务性能分析系统
背景近期AmazonFargate在中国区正式落地，因Fargate使用Serverless架构，更加适合对性能要求不敏感的服务使用，Pyroscope是一款基于Golang开发的应用程序性能分析工具，Pyroscope的服务端为无状态服务且性能要求不敏感，使用EKSFargate搭建Pyroscope，Pyroscope的客户端......
Window任务计划定时任务执行Kettle Spoon单个转换文件或本地资源库Local-KSPOON中的转
1.Window任务计划定时任务执行KettleSpoon单个转换文件或本地资源库Local-KSPOON中的转换*Window任务计划定时任务执行KettleSpoon本地资源库Local-KSPOON中的转换：（1）准备.bat文件和日志文件 D:cdD:\software\KettleSpoon\data-integrationPan.bat-repLocalSpoon-KSPOO......
Flink Cdc MySQL 整库同步到 StarRocks
这段时间开始调研使用StarRocks做准实时数据仓库：flinkcdc实时同步数据到StarRocks，然后在StarRocks中做分层计算，直接把StarRocks中的ADS层提供给BI查询。架构如下：由于用到的表比较多，不能用FlinkSQL给每个表都做个CDC的任务（任务太多不好维护、对数据库又可能有......

风控模型指标全解：KS、LIFT、GINI等

Gini

KS值

LIFT提升度

参考资料

相关文章

赞助商

阅读排行