首页 > 其他分享 >woe、iv、ks的计算和定义

woe、iv、ks的计算和定义

时间:2024-03-20 20:00:14浏览次数:26  
标签:组中 响应 样本 iv ks WOE 客户 分组 woe

https://www.cnblogs.com/wqbin/p/10547628.html
WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种编码形式。

要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(也叫离散化、分箱等等,说的都是一个意思)。分组后,对于第i组,WOE的计算公式如下:

其中,pyi是这个组中响应客户(风险模型中,对应的是违约客户,总之,指的是模型中预测变量取值为“是”或者说1的个体)占所有样本中所有响应客户的比例,pni是这个组中未响应客户占样本中所有未响应客户的比例,#yi是这个组中响应客户的数量,#ni是这个组中未响应客户的数量,#yT是样本中所有响应客户的数量,#nT是样本中所有未响应客户的数量。

从这个公式中我们可以体会到,WOE表示的实际上是“当前分组中响应客户占所有响应客户的比例”和“当前分组中没有响应的客户占所有没有响应的客户的比例”的差异。

对这个公式做一个简单变换,可以得到:

变换以后我们可以看出,WOE也可以这么理解,他表示的是当前这个组中响应的客户和未响应客户的比值,和所有样本中这个比值的差异。这个差异是用这两个比值的比值,再取对数来表示的。WOE越大,这种差异越大,这个分组里的样本响应的可能性就越大,WOE越小,差异越小,这个分组里的样本响应的可能性就越小。
这就是WOE编码所表示的意义。

iv:

ks:

标签:组中,响应,样本,iv,ks,WOE,客户,分组,woe
From: https://www.cnblogs.com/chenqianguan/p/18085960

相关文章

  • 机器人路径规划:基于迪杰斯特拉算法(Dijkstra)的机器人路径规划(提供Python代码)
    迪杰斯特拉算法(Dijkstra)是由荷兰计算机科学家狄克斯特拉于1959年提出的,因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法,解决的是有权图中最短路径问题。迪杰斯特拉算法主要特点是从起始点开始,采用贪心算法的策略,每次遍历到始点距离最近且未访问过的顶点的邻......
  • Android第一行代码——快速入门 Kotlin 编程(3.6 Activity 的最佳实践)
    目录3.6        Activity的最佳实践3.6.1    知晓当前是在哪一个Activity3.6.2    随时随地退出程序 3.6.3    启动Activity的最佳写法3.6        Activity的最佳实践        关于Activity,你已经掌握了非常多......
  • Vivado错误提示可能的解决方法
    时间版本内容2024/03/20V0初版SimulatorErrorAfatalrun-timeerrorwasdetected.Simulationcannotcontinue.此错误表示仿真时间出了问题。最常见的问题就是,出现了类似always#0clk=~clk;这样的0延时循环。SynthesizeCriticalWarningconditionalex......
  • linux 中shell脚本中遇到 Runtime error (func=(main), adr=22): Divide by zero
    在Linux中编写Shell脚本时,遇到“Runtimeerror(func=(main),adr=22):Dividebyzero”这样的错误通常是因为在脚本中进行了除以零的操作,类似于编程语言中的除零错误。要解决这个问题,您需要检查Shell脚本中涉及到除法运算的地方,确保分母不为零。下面是一个示例S......
  • Counts the number of the messages received and sent
    我的博客园:https://www.cnblogs.com/CQman/本文版权归CQman和博客园共有,欢迎转载,但必须保留此段声明,并给出原文链接,谢谢合作。Symptom Countsthenumberofmessagesreceivedandsent统计接收和发送邮件的数量说明:管理员想知道:所有用户邮箱接受和发送的邮件数量注意:此......
  • KSM的使用
    使能KSMKSM只会处理通过madvise系统调用显式指定的用户进程地址空间,因此用户程序想使用这个功能就必须在分配地址空间时显式地调用madvise(addr,length,MADV_MERGEABLE)。如果用户想在KSM中取消某一个用户进程地址空间的合并功能,也需要显式地调用madvise(addr,length,MADV_UNMERGEABLE......
  • VMware Live Site Recovery 9.0 - 数据中心灾难恢复 (DR)
    VMwareLiveSiteRecovery9.0-数据中心灾难恢复(DR)VMwareSiteRecoveryManager,VMwareSRM现已更名为VMwareLiveSiteRecovery请访问原文链接:https://sysin.org/blog/vmware-live-site-recovery-9/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgVMware......
  • VMware Live Recovery 9.0 - 多云实时恢复
    VMwareLiveRecovery9.0-多云实时恢复VMwareLiveCyberRecovery+VMwareLiveSiteRecovery请访问原文链接:https://sysin.org/blog/vmware-live-recovery/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgVMwareLiveRecovery通过跨混合云的统一管理体验大......
  • Codeforces Round 935 (Div. 3) A-G
    A传送门  先考虑无解情况,外在人的数量如果%3之后还剩下x人,只能靠第三类综合性人y来补充进去,如果x+y小于3则无解,有解只需要向上取整即可。#include<bits/stdc++.h>usingll=longlong;typedefstd::pair<int,int>PII;typedefstd::array<int,4>ay;constintN=......
  • 《比特与瓦特》揭秘防滑黑科技 华为 DriveONE定义未来底盘
    亿欧数据显示:2023年,中国新能源汽车销量达950万辆,其中智能电动汽车销量为614万辆,渗透率为65%。预计到2025年,新能源汽车销量将达到1524万辆,智能电动汽车销量将为1220万辆,渗透率达80%。智能汽车正在走进千家万户,我们已经可以切身体验到驾驶方式的变化。从传统汽车到智能汽车,智能化主......