首页 > 其他分享 >风控模型指标全解:KS、LIFT、GINI等

风控模型指标全解:KS、LIFT、GINI等

时间:2023-05-09 16:47:16浏览次数:70  
标签:GINI 模型 样本 prop KS bad LIFT 风控

目录

实习接触到的数据大多来自于金融公司,这类模型关注风险,目的是降低风险而使得在风险和收益的博弈中最大化利润。模型评价指标不局限于准确率等常规指标,往往引入了更复杂的指标衡量模型的效果。以下介绍风控场景下常见的模型评价指标。

数据含义

模型处理的数据是客户的身份信息(性别、年龄、教育程度等)、存款情况、交易行为等信息。原始数据标签一般为二分类,其中0代表好客户,1代表坏客户。建模时最常用到逻辑回归,模型预测这个客户是的概率(如表示信用不良、贷款逾期等)。

风控场景下关注的模型指标包括但不限于以下表格:

其中统计学/机器学习中通用的概念,如混淆矩阵、AUC,ROC等不再赘述。

Gini

KS值

定义:
KS全称Kolmogorov-Smirnov,是信用评分和其他很多学科中常见的统计量,用于衡量模型对正负样本的区分度。KS值为累计坏人占比与累计好人占比的差值绝对值的最大值。

KS检验:比较频率分布f(x)与理论分布g(x)或两个观测值分布的是否一致检验方法,原假设两个数据分布一致或数据符合理论分布,统计量D=max|f(x)−g(x)|。

计算方式:

与ROC曲线类似,我们可以将累计坏人占比与累计好人看作不同阈值下的TPR和FPR,则

\[KS = \max(TPR-FPR) \]

取值说明:

  • KS<0.2 模型的区分能力不高,价值不大;
  • 0.2<=KS<0.4 一般金融机构开发的评分模型KS大部分都集中在这个区间内,模型具备一定的区分能力和使用价值,此时可以结合其他指标继续观察调优模型;
  • 0.4<=KS<=0.7 模型区分能力比较好,模型有应用价值;
  • KS>0.7 模型好的难以令人置信,可能在变量中加入了业务目标衍生指标,需要对模型特征工程进行排查。

根据KS,可以选择对应阈值作为分界,最大化过滤坏人比例。

LIFT提升度

定义:

模型对坏样本的预测能力相比随机选择的倍数,当LIFT>1则说明模型表现优于随机选择。

计算方式:

将样本划分多个桶/组/区间,计算每个区间内样本的坏样本率与整体坏样本率的比值。

通常将模型的输出信用评分以bucket=10相等分位数(quantile)分箱,按照从低到高排序(违约概率从高到低),计算累计坏样本占比与累计总样本占比的比值。如下表,其中

%Bad = 当前行#Bad / sum(#Bad)
%CumBad = 上一行%Bad + 上一行%CumBad
LIFT = %Bad / %CumBad

第一行 LIFT=4.1013表示,我们使用这个模型相比随机选择对坏样本的预测能力提升的倍数。比如对于金融应用中的贷款场景,如果直接不加筛选,10000人中可能遇到100个坏客户;我们选择大于655信用分作为放贷条件阈值,则模型选择的10000个客户中可能只有60个坏客户。模型虽然不能完全过滤全部坏客户,但能坏客户的比例,从而降低风险。

以toad库提供的KS_bucket函数为例:

该函数实现的源码可见toad/metrics.py,从源码上可以看到,计算lift使用

agg2['lift'] = agg2['bad_prop'] / agg2['total_prop'],即下表中 bad_prop 与 total_prop 比值。与前面定义稍有不同,计算的bad_prop并不是累计值,因此得到的lift为每一组内的提升值。其中

bad_rate = 每一组bads / 每一组总数
odds = 每一组bads / 每一组goods

bad_prop = 每一组bads / 所有bads总数
lift = bad_prop / total_prop(每一组总数占全部比例)

而 cum_lift 的结果与上面的定义一致。

reverse_suffix = '_rev' (或为空,根据ks调整)
agg2['cum_lift'] = agg2['cum_bads_prop' + reverse_suffix] / agg2['cum_total_prop' + reverse_suffix]

参考资料

指标表格:风控领域常用评估指标:ROC/AUC、KS、Gain、Lift等 - penny618 - 博客园 (cnblogs.com)

KS:风控模型评估指标介绍(KS、AUC & Gini) - 知乎 (zhihu.com)

LIFT: 怎么做模型提升度的曲线? - 知乎 (zhihu.com)

标签:GINI,模型,样本,prop,KS,bad,LIFT,风控
From: https://www.cnblogs.com/izcat/p/17385504.html

相关文章

  • vCenter Server 8.0U1 OVF:在 Fusion 和 Workstation 中快速部署 vCSA
    vCenterServer8.0U1系列更新请访问原文链接:https://sysin.org/blog/vmware-vcenter-8-ovf/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.org新的IA/GA模型vSphere8版本发布转向了新的IA/GA(初始可用性/通用可用性)模型。发布周期如下:所有主要和更新的vSpher......
  • 解决银河麒麟V10系统Failed to download metadata for repo ‘ks10-adv-os‘报错问题
    原文链接:https://blog.csdn.net/m0_53967669/article/details/127283289在使用银河麒麟系统时会时不时的安装程序,yum命令是最方便快捷的命令,但是在使用的过程中出现了Failedtodownloadmetadataforrepo'ks10-adv-os’这样的报错如何解决呢?经过了多次的尝试,小编终于成功解决,......
  • [PLC]三菱FX5U WORKS3中使用特殊继电器/特殊寄存器注释显示
    1.菜单栏"视图"-->"多个注释"-->"注释读取"2.勾选如图所示:3.点击确定,例如sm412这种特殊继电器/特殊寄存器就会自动显示注释.......
  • 缺少Jackson jar包,导致对象无法转化为json数据输出
       用于Json的序列化(serialization)和反序列化(deserialization)。Jackson包含三个包jackson-core、jackson-annotation、jackson-databind,作用如下  <dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-databind</a......
  • kingbase之ksql命令工具
    原文链接:https://blog.csdn.net/carefree2005/article/details/127508686一、ksql命令工具简介  ksql是人大金仓提供给DBA的与KES数据库交互的命令行客户端程序。熟练使用ksql工具可以帮助DBA快速的操作和维护数据库。博文实验环境:操作系统:centos7.6kingbase版本:V008R006C006B......
  • 1163 Dijkstra Sequence + 层序遍历 + 链式前向星
    PAT题目链接:https://pintia.cn/problem-sets/994805342720868352/exam/problems/1478635670373253120这题踩了太多坑,本来没什么内容,硬是断断续续查了三天的bug:第一天:循环的时候内部判断逻辑不要写在for循环里,否则本该continue的逻辑,硬生生变成了break。我真是脑袋瓜秀逗了才会......
  • 分析游戏中的金钱交易:Multi-view Attention Networks
    文章目录1.摘要2.引入3.游戏数据描述3.1逆水寒中的游戏日志3.2社交图分析3.3行为序列3.4角色属性构造4.MVAN模型4.1multi-graphattentionnetwork4.2behaviourattentionnetwork4.3behaviourattentionnetwork4.4DataSourceAttentionNetwork5.模型效果5.1baseline......
  • 基于 EKS Fargate 搭建微服务性能分析系统
     背景近期AmazonFargate在中国区正式落地,因Fargate使用Serverless架构,更加适合对性能要求不敏感的服务使用,Pyroscope是一款基于Golang开发的应用程序性能分析工具,Pyroscope的服务端为无状态服务且性能要求不敏感,使用EKSFargate搭建Pyroscope,Pyroscope的客户端......
  • Window任务计划定时任务执行Kettle Spoon单个转换文件或本地资源库Local-KSPOON中的转
    1.Window任务计划定时任务执行KettleSpoon单个转换文件或本地资源库Local-KSPOON中的转换*Window任务计划定时任务执行KettleSpoon本地资源库Local-KSPOON中的转换:(1)准备.bat文件和日志文件 D:cdD:\software\KettleSpoon\data-integrationPan.bat-repLocalSpoon-KSPOO......
  • Flink Cdc MySQL 整库同步到 StarRocks
    这段时间开始调研使用StarRocks做准实时数据仓库:flinkcdc实时同步数据到StarRocks,然后在StarRocks中做分层计算,直接把StarRocks中的ADS层提供给BI查询。架构如下:由于用到的表比较多,不能用FlinkSQL给每个表都做个CDC的任务(任务太多不好维护、对数据库又可能有......