首页 > 其他分享 >一些风控知识

一些风控知识

时间:2023-12-11 19:12:29浏览次数:24  
标签:分箱 变量 逾期 知识 风控 协方差 标准差 一些 IV

切比雪夫大数定理

所有数据中,至少有3/4(或75%)的数据位于平均数2个标准差范围内。

所有数据中,至少有8/9(或88.9%)的数据位于平均数3个标准差范围内。

所有数据中,至少有24/25(或96%)的数据位于平均数5个标准差范围内

*****IV值会受分箱数量影响,因此即使是同样的样本,随着分箱数量改变,IV值也会发生改变,而AUC和KS是不变的。
从上面的结果可以看出,当分箱比较细的时候,对KS结果影响不大,但是如果分箱比较粗的话对KS会有一定的影响。

从IV值的公式中,易得变量的分组越多,IV值越大。但是分组分的太多,就会使得每个分组的数据量变少,导致细项分组的分布不稳定。
所以,我们在使用IV值筛选变量的时候,不能为了提高IV值一味地将分箱的数目提高,也要兼顾变量的业务含义和分布的稳定性。

风控指标
M0:正常资产,无逾期,有时也用C表示

M1:逾期一期,或逾期1-30天

M2:逾期两期,或逾期31-60天

M3:逾期三期,或逾期61-90天

M4:逾期四期,或逾期91-120天

M5:逾期五期,或逾期121-150天

M6:逾期六期,或逾期151-180天

M6+:逾期大于六期,或逾期大于180天。一般逾期大于180天,会进行坏账核销。

MOB的最大值指的是信贷产品期限
Eg:MOB0指的是资产放款至月底;MOB1指的是资产放款后第二个完整的月份;MOB2指的是资产放款后第三个完整的月份----如2019.11.13放款,
那么MOB0就为2019.11,MOB1为2019.12。

协方差和相关系数的关系与区别
协方差:
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
注:协方差大小,会受X,Y数据大小的影响,所以只能通过协方差的正负,来判断是正相关还是负相关,不能反映相关性的程度,所以相关系数就此诞生

相关系数:
公式翻译一下,就是XY的协方差除X的标准差和Y的标准差
所以,相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。是用来研究变量之间线性相关程度的量,取值范围是[-1,1]。

psi 指标模型稳定性
0~0.1 好 没有变化或者很少变化
0.1~0.25 略不稳定 有变化建议监控后续变化
大于0.25 不稳定 发生大变化,进行特征项分析

标签:分箱,变量,逾期,知识,风控,协方差,标准差,一些,IV
From: https://www.cnblogs.com/chenqianguan/p/17895153.html

相关文章

  • UE4 开发一些记录
    Construct函数里一般是创建材质,设置材质CreateDynamicMaterialInstance 创建动态材质,只有这个材质才可以改参数       SetVectorParameterValue       SetScalerParameterValue       AddTextRenderComponent 添加文字component    ......
  • 跑大数据量遇到的一些问题
    1、ORA-00604:递归SQL级别1出现错误 ORA-38301:无法对回收站中的对象执行DDL/DML解决办法:增加表空间文件ALTERTABLESPACE SPACENAME ADDDATAFILE'F:\TABLESPACE\SPACENAME_ADD3.DBF'SIZE2048M;2、ORA-00060:等待资源时检测到死锁解决办法:中间件调整位进程模......
  • 知识点链接
    在科研中时常会遇到新的知识点与代码书写问题,把网上参考的信息进行汇总,以备不时之需。R语言经典包的cheatsheet:https://rstudio.github.io/cheatsheets/contributed-cheatsheets.html中国官方最新地图的下载:https://www.jianshu.com/p/74e1475884afR语言当中的数据结构与算法:ht......
  • 关于代码质量度量和分析的一些总结
     最近团队做CMMI3认证,这期间涉及到了代码质量度量。花了点时间做了总结,分享给大家。先看一张整体的图,然后逐个指标展开说明。 一、单元测试覆盖率单元测试覆盖率(Coverage)是一个度量单元测试覆盖了多少代码的指标。它是一种衡量测试质量的方法,用来指示我们的测试用例覆盖了......
  • 关于代码质量度量和分析的一些总结
    最近团队做CMMI3认证,这期间涉及到了代码质量度量。花了点时间做了总结,分享给大家。先看一张整体的图,然后逐个指标展开说明。 一、单元测试覆盖率单元测试覆盖率(Coverage)是一个度量单元测试覆盖了多少代码的指标。它是一种衡量测试质量的方法,用来指示我们的测试用例覆盖了代码......
  • docker基础知识
    目录1.docker简介1.为什么要创建隔离的环境?2.为什么dockeri可以比虚拟机极大的节省资源?3.docker基础概念(1)镜像(Image)(2)容器(Container)2.docker使用1.docker安装2.docker命令dockersearch查询镜像dockerpull拉取镜像dockerimages查看镜像dockerbuild构建镜像dockerstart......
  • linux基础知识
    目录1.linux了解(1)界面基础2.文件管理(1)文件目录查看(2)文件目录管理ls:列出目录cd:切换目录pwd:显示目前所在的目录mkdir/rm:新建与删除文件夹(3)rz/sz:文件上传与下载(4)unzip:文件解压与压缩(5)文件内容查看1)cat:由第一行开始显示文件内容2)nl:由第一行开始显示文件内容,并显示行号(6)echo......
  • CPlusPlus 断言知识点总结
    在C++中,断言(assertion)是一种用于在程序中诊断和调试错误的工具。断言是一个宏,通常用于检查程序运行时的条件是否为真。如果条件为假,断言将触发并终止程序的执行,通常伴随着错误消息的输出。断言的目的是在开发和调试阶段快速捕获和定位问题。C++中的断言主要通过<cassert>头文件......
  • 一些神奇的运算优先级
    首先来看这个代码intf(int*p){ inty=(*p)*2; (*p)++; returny;}intmain(){ intx=10; cout<<x+f(&x); return0;}这个代码输出的是31,感觉似乎f加了一个括号?那再看看这个代码intf(int*p){ inty=(*p)*2; (*p)++; returny;}intmain(){ intx=10......
  • STM32学习笔记_GPIO相关知识&LED流水灯
    GPIO的内部结构:在STM32中,所有的外设都是挂载在APB2外设总线上的,GPIO内包含了寄存器和驱动器,内核通过APB2总线对寄存器进行读写,寄存器的每一位对应每一个引脚。驱动器是用来增强GPIO驱动能力的GPIO位的内部结构:在下结构图中,信号从右边的I/0引脚输入,通过内部的上拉或下拉开关进行到TT......