woe、iv、ks的计算和定义

时间：2024-03-20 20:00:14浏览次数：26

https://www.cnblogs.com/wqbin/p/10547628.html
WOE的全称是“Weight of Evidence”，即证据权重。WOE是对原始自变量的一种编码形式。

要对一个变量进行WOE编码，需要首先把这个变量进行分组处理（也叫离散化、分箱等等，说的都是一个意思）。分组后，对于第i组，WOE的计算公式如下：

其中，pyi是这个组中响应客户（风险模型中，对应的是违约客户，总之，指的是模型中预测变量取值为“是”或者说1的个体）占所有样本中所有响应客户的比例，pni是这个组中未响应客户占样本中所有未响应客户的比例，#yi是这个组中响应客户的数量，#ni是这个组中未响应客户的数量，#yT是样本中所有响应客户的数量，#nT是样本中所有未响应客户的数量。

从这个公式中我们可以体会到，WOE表示的实际上是“当前分组中响应客户占所有响应客户的比例”和“当前分组中没有响应的客户占所有没有响应的客户的比例”的差异。

对这个公式做一个简单变换，可以得到：

变换以后我们可以看出，WOE也可以这么理解，他表示的是当前这个组中响应的客户和未响应客户的比值，和所有样本中这个比值的差异。这个差异是用这两个比值的比值，再取对数来表示的。WOE越大，这种差异越大，这个分组里的样本响应的可能性就越大，WOE越小，差异越小，这个分组里的样本响应的可能性就越小。
这就是WOE编码所表示的意义。

iv：

ks:

标签：组中,响应,样本,iv,ks,WOE,客户,分组,woe
From： https://www.cnblogs.com/chenqianguan/p/18085960

机器人路径规划：基于迪杰斯特拉算法(Dijkstra)的机器人路径规划（提供Python代码）
迪杰斯特拉算法(Dijkstra)是由荷兰计算机科学家狄克斯特拉于1959年提出的，因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法，解决的是有权图中最短路径问题。迪杰斯特拉算法主要特点是从起始点开始，采用贪心算法的策略，每次遍历到始点距离最近且未访问过的顶点的邻......
Android第一行代码——快速入门 Kotlin 编程（3.6 Activity 的最佳实践）
目录3.6 Activity的最佳实践3.6.1 知晓当前是在哪一个Activity3.6.2 随时随地退出程序 3.6.3 启动Activity的最佳写法3.6 Activity的最佳实践关于Activity，你已经掌握了非常多......
Vivado错误提示可能的解决方法
时间版本内容2024/03/20V0初版SimulatorErrorAfatalrun-timeerrorwasdetected.Simulationcannotcontinue.此错误表示仿真时间出了问题。最常见的问题就是，出现了类似always#0clk=~clk;这样的0延时循环。SynthesizeCriticalWarningconditionalex......
linux 中shell脚本中遇到 Runtime error (func=(main), adr=22): Divide by zero
在Linux中编写Shell脚本时，遇到“Runtimeerror(func=(main),adr=22):Dividebyzero”这样的错误通常是因为在脚本中进行了除以零的操作，类似于编程语言中的除零错误。要解决这个问题，您需要检查Shell脚本中涉及到除法运算的地方，确保分母不为零。下面是一个示例S......
Counts the number of the messages received and sent
我的博客园：https://www.cnblogs.com/CQman/本文版权归CQman和博客园共有，欢迎转载，但必须保留此段声明，并给出原文链接，谢谢合作。Symptom Countsthenumberofmessagesreceivedandsent统计接收和发送邮件的数量说明：管理员想知道：所有用户邮箱接受和发送的邮件数量注意：此......
KSM的使用
使能KSMKSM只会处理通过madvise系统调用显式指定的用户进程地址空间，因此用户程序想使用这个功能就必须在分配地址空间时显式地调用madvise（addr，length，MADV_MERGEABLE）。如果用户想在KSM中取消某一个用户进程地址空间的合并功能，也需要显式地调用madvise（addr，length,MADV_UNMERGEABLE......
VMware Live Site Recovery 9.0 - 数据中心灾难恢复 (DR)
VMwareLiveSiteRecovery9.0-数据中心灾难恢复(DR)VMwareSiteRecoveryManager,VMwareSRM现已更名为VMwareLiveSiteRecovery请访问原文链接：https://sysin.org/blog/vmware-live-site-recovery-9/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgVMware......
VMware Live Recovery 9.0 - 多云实时恢复
VMwareLiveRecovery9.0-多云实时恢复VMwareLiveCyberRecovery+VMwareLiveSiteRecovery请访问原文链接：https://sysin.org/blog/vmware-live-recovery/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgVMwareLiveRecovery通过跨混合云的统一管理体验大......
Codeforces Round 935 (Div. 3) A-G
A传送门先考虑无解情况，外在人的数量如果%3之后还剩下x人，只能靠第三类综合性人y来补充进去，如果x+y小于3则无解，有解只需要向上取整即可。#include<bits/stdc++.h>usingll=longlong;typedefstd::pair<int,int>PII;typedefstd::array<int,4>ay;constintN=......
《比特与瓦特》揭秘防滑黑科技华为 DriveONE定义未来底盘
亿欧数据显示：2023年，中国新能源汽车销量达950万辆，其中智能电动汽车销量为614万辆，渗透率为65%。预计到2025年，新能源汽车销量将达到1524万辆，智能电动汽车销量将为1220万辆，渗透率达80%。智能汽车正在走进千家万户，我们已经可以切身体验到驾驶方式的变化。从传统汽车到智能汽车，智能化主......

woe、iv、ks的计算和定义

相关文章

赞助商

阅读排行