金控风控：Python实现基于数据技巧的拒绝推断

时间：2024-06-21 21:56:31浏览次数：27

常说的拒绝推断（Inference methods），通常是指通过数据分析方法修正模型的参数估计偏差。拒绝推断的主要意义是希望修正建模样本和实际全量样本之间的差异，本质上是为了降低模型参数估计的偏差。

拒绝推断场景下有如下三个概念。

已知好坏标签（Know Good Bad，KGB）样本：准入模型允许通过的样本集，已知标签。由KGB样本训练的模型又叫KGB模型。
未知标签（Inferred Good Bad，IGB）拒绝样本：准入模型拒绝的样本集，未知标签。由于IGB样本没有标签，通常不会用于训练模型。在部分方法中可能会生成伪标签，从而参与建模过程。 ·
全量（All Good Bad，AGB）样本：包含KGB和IGB两部分的全量样本集。由该部分数据训练得到的模型又称AGB模型。

一种常见的思路是，直接使用KGB模型在拒绝样本上做预测，并将低分样本（如分数最低的20%样本）认为是负样本，带入模型进行估计，其余拒绝样本全部视为灰色样本，不予考虑。这种推断方法就叫作硬截断法（Hard Cutoff）。硬截断法假设“逾期”与“放款”之间相互独立。

利用KGB模型进行打分，按照逾期概率降序排列，选择截断点（cut-off）进行截断后，仅将截断点以下的蓝色部分作为负样本带入模型进行学习，从而修正模型的偏差。接下来我们通过一个申请评分卡的例子，看看如何在Python中实现基于数据技巧的拒绝推断。

首先加载相关库和数据。

根据KGB数据训练KGB模型。

简单实现硬截断法。

相比于KGB样本，IGB客群的负样本占比更大。低分IGB样本的负样本占比相比于IGB客群也会更大，但仍有部分样本的真实标签应为正样本。在对精度较为敏感的风控系统中，硬截断法显然是不合理的。因此在实际项目中，通常使用多个差异化较大的模型进行交叉筛选，将多模型评分均较低的样本作为负样本。

由差异较大的多个模型组合进行判断，如分别使用逻辑回归模型、决策树模型进行投票或加权平均，可以有效减少误判的概率。

标签：Python,标签,模型,样本,风控,截断,KGB,IGB,金控
From： https://blog.csdn.net/R418520/article/details/139870690

初识Python----“三剑客“之matplotlib(个人总结，一些简单的图形使用，适用于初学者)
Matplotlib是Python中最受欢迎的数据可视化软件包之一，支持跨平台运行，它是Python常用的2D绘图库，同时它也提供了一部分3D绘图接口,Matplotlib通常与NumPy、Pandas一起使用，是数据分析中不可或缺的重要工具之一。在数据分析中,我们......
python爬虫之iframe处理+动作链
python爬虫之iframe处理+动作链selenium处理iframe1、如果定位的标签存在于iframe标签之中，则必须使用switch_to.frame(id)2、动作链（拖动）：fromselenium.webdriverimportActionChains（1）实例化一个动作链对象：action=ActionChains(bro)（2）click_and_hold(div)：长按且点击操......
横向LQR、纵向PID控制进行轨迹跟踪以及python实现
横向LQR、纵向PID控制进行轨迹跟踪以及python实现附赠自动驾驶最全的学习资料和量产经验：链接一、LQR问题模型建立：理论部分比较成熟，这里只介绍demo所使用的建模方程：使用离散代数黎卡提方程求解系统状态矩阵：输入矩阵：A矩阵：B矩阵：二、代码实现#导入相关包imp......
【每日一练】python入门级小案例
题目数字从小到大排序用户随意分别输入三个数，利用列表的排序方法sort()从小到大排序。代码: 输出结果: 代码分析:先创建三个变量x,y,z，用input()输入获取值;再创建一个列表，元素分别是x,y,z三个变量;利用列表的排序方法sort(),对列表从小到大排序;用for循环遍......
零基础学习python-1.安装python
1.安装python众所周知，若想学习python就得有一台电脑，如果手机端的同学也想玩python编程的话，那我建议你安装一个QPython玩玩就可以，若是想跟深度学习，那请各位少爷小姐们，一同跟随我，一步步教会你安装python及其编译器第一步.找python官网注意：请识别官网，python是免费的，别选错了......
Python基础教程（二十四）：日期和时间
......
Python统计实战：一题搞定一元线性回归的回归系数、显著性及预测值计算
为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能，从而更快地掌握解决问题所需的能力。（以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。）练习题随机抽取10家航空公司，对其最近一年的航班准点率......
Python统计实战：一题搞定一元线性回归分析、模型诊断分析
为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能，从而更快地掌握解决问题所需的能力。（以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。）练习题下面是来自R语言的anscombeh数据集（前3行和后3行......
Python统计实战：一题搞定双因子方差分析（交互效应分析）
为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能，从而更快地掌握解决问题所需的能力。（以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。）练习题城市道路交通管理部门为研究不同路段和不同时段......
python web框架哪家强？Flask、Django、FastAPI对比
前言当你掌握了python的基础知识，并且会用和HTML和CSS编写简单的静态网页。现在你只需再掌握一个pythonweb框架的知识，就可以开始编写一个动态的网站了。目前市面比较流程的pythonweb框架有三个flask、Django、FastAPI。接下来我们对比一下。他们三个各自有什么特点。Flas......

金控风控：Python实现基于数据技巧的拒绝推断

相关文章

赞助商

阅读排行