首页 > 其他分享 >时序特征构造

时序特征构造

时间:2023-07-19 16:35:58浏览次数:36  
标签:借款 风险 特征 天数 构造 时序 客户 行为

信贷时序数据与特征工程介绍 --求是汪

1. 常规统计特征

把客户行为按最小时间粒度统计完毕后,我们就会得到一个分布。接下来则是利用统计函数最大值(MAX)、最小值(MIN)、平均值(AVG)、标准差(STD)来描述以上分布特征。
但是,这些指标在统计时只能对给定的数据集合计算,没有考虑到时间序列变化信息。换言之,什么时间段在持续上升,什么时间段在持续下降,什么时间段断档形成空窗期,这些信息都被掩盖了。

2. 时间距离特征

用以刻画客户最远一次、最近一次或者某个特殊事件发生的时点。例如:
● 最近一次申请日距离观察点的日期差(天数)
● 最近一次取到最大值、最小值的事件时点距离观察点的日期差(天数)
● 最近一次逾期距离观察点的日期差(天数)

3. 行为波动特征

用以刻画客户某段连续时间内的行为变化特征。例如:
● 最长持续上升(或下降)的时间跨度(天数)。
● 最长睡眠期(天数)。即,客户多久没有活跃了?
● 连续行为窗口出现次数。
在信贷风控中,变化趋势是衡量风险非常重要的维度。我们喜欢稳定,但是风险天生具有易变性,当有变化的趋势就意味着风险,也意味着机遇。例如,当客户近期在行业内借款申请次数在上升时,我们就可以判断客户资金紧张,故而在到处借钱。那么,我们需要思考:

  1. 业务侧:客户是否因为我们的额度不够,无法满足其资金需求而跑到其他平台借款?出于余额增长的目标,我们能不能给客户提额呢?
  2. 风险侧:该客户的还款能力是否出现问题?我们给他放开额度后,我们能否承受风险?那么我们就需要给客户打一下风险分,判断客户风险。
    为捕捉客户行为变化趋势,我们可以用一种简单的方法:最近N个月次数 / 最近M个月次数(N < M)。例如,多头变量中,该值越高,说明借款申请记录更为集中在近期。一般来说,近期行为对于识别短期欺诈风险更有用,远期行为对于识别长期信用风险更有用。

4. 集中度特征

用以刻画客户行为的偏好程度。如果说时间维度是纵向视角,那么集中度特征则是横截面视角。通常以比例特征形式出现。例如:
● 一天内集中于哪个时间段活动?
● 借款机构中集中于哪些机构?
● 借款金额倾向于什么数目(例如1K以内,1K-5K,5K以上)?
● 购买的商品内集中于买什么品类?

标签:借款,风险,特征,天数,构造,时序,客户,行为
From: https://www.cnblogs.com/tian1022/p/17565968.html

相关文章

  • Java 默认构造
    Java默认构造方法的实现作为一名经验丰富的开发者,你将帮助一位刚入行的小白了解如何实现Java中的默认构造方法。在本篇文章中,我们将按照以下步骤来进行讲解:创建一个Java类添加默认构造方法编写构造方法的代码逻辑让我们一步一步地来实现这些步骤。1.创建一个Java类首先,......
  • 拷贝构造函数 和 移动构造函数 深拷贝
    采用了深拷贝的方式,obj2 和 obj3 的 data 成员变量指向不同的内存空间,因此可以独立地释放资源而不会出现重复释放的问题.classMyClass{public:int*data;intsize;//默认构造函数MyClass():data(nullptr),size(0){}//拷贝构造函数(深拷......
  • 拷贝构造函数 和 移动构造函数的 浅拷贝
    classMyClass{public:int*data;//默认构造函数MyClass():data(nullptr){}//拷贝构造函数(浅拷贝)MyClass(constMyClass&other):data(other.data){}//移动构造函数(浅拷贝)MyClass(MyClass&&other)noexcept:data(other.data......
  • 【测试联调】如何在前后端测试联调时优雅的构造异常场景
    背景当前的应用都使用了前后端分离的架构,前后端系统需要协同以实现各种功能。后端系统通常负责处理业务逻辑、数据存储和与其他服务的交互,而前端则负责用户界面和用户交互。而在前后端数据交互的过程中,各种异常和错误都有可能发生,确认异常发生时前后端系统的处理是否合理是测试验......
  • 如何使用自动化构造随机路由模型
    为什么要仿真随机路由?路由器测试中,为了最大程度还原现网路由情况,评估路由器在现网环境下稳定工作各项指标,需要对导入路由进行离散仿真,目前路由仿真可分为导入路由与生成路由两种方式,导入路由需要现网路由表导入,本文讨论重点为生成路由方式。自动化生成路由能解决什么问题?使用用......
  • TDengine 的查询性能与老牌时序数据库相比如何?来看看
    在上一篇文章《IoT场景下写入性能:TDengine=16.2xInfluxDB》中,我们基于IoT场景下的TSBS时序数据库(TimeSeriesDatabase)性能基准测试报告对三大数据库写入性能进行了相关解读,较为直观地展现出了TDengine的众多写入优势。本篇文章将以查询性能作为主题,给IoT场景下正在为......
  • shared_ptr包装this指针构造bug
    目录成员函数里用shared_ptr包装this指针,当shared_ptr析构了,就会调用this对象的析构函数,是非常可怕的事情。classA{voideat(){std::shared_ptrp(this);ptr->status="吃了";}}voidfunc(){Aa;a.eat();//eat里......
  • uni-app http.js 请求封装(构造函数版本)
    import{getToken,removeToken}from"./auth.js"importconfigfrom'./config.js'//默认配置constDEFAULT_CONFIG={baseUrl:process.env.NODE_ENV==='development'?config.url_qa_api:config.url_online_api,//这里是自定......
  • pytorch可视化模型对一维信号特征学习程度
    PyTorch可视化模型对一维信号特征学习程度在机器学习和深度学习领域中,可视化模型对特征学习程度非常重要。通过可视化,我们可以更好地理解模型学到了哪些特征,并且可以帮助我们分析模型的性能和调整模型的结构。在本文中,我们将使用PyTorch库来可视化模型对一维信号特征的学习程度。......
  • IoT 场景下 TDengine 与老牌时序数据库怎么选?看看这份TSBS报告
    上周一,TDengine正式发布了IoT场景下基于TSBS的时序数据库(TimeSeriesDatabase,TSDB)性能基准测试报告。该报告模拟虚拟货运公司车队中一组卡车的时序数据,预设了五种卡车规模场景,在相同的AWS云环境下运行了TDengine3.0、TimescaleDB2.10.1和InfluxDB1.8.10,从四大维度进......