一、选题的背景
一个组织想要预测谁是消费贷款产品的潜在违约者。他们有基于他们所观察到的顾客历史行为的数据。因此,当他们获得新客户时,他们希望预测谁的风险更大,谁没有。此数据集为基于用户行为的贷款预测的训练集。所以想寻找数据集所提供的用户基本信息,消费行为,还款情况等,建立准确的逾期预测模型,以预测用户是否会逾期还款。
1.字段描述
字段名称 | 字段类型 | 字段说明 |
---|---|---|
Id | 数值型 | 用户Id |
Income | 数值型 | 收入 |
Age | 数值型 | 年龄 |
Experience | 数值型 | 多年的用户经验(年) |
Married/Single | 字符型 | 婚姻状况 |
House_Ownership | 字符型 | 房子情况(拥有还是租房或者都不是) |
Car_Ownership | 字符型 | 汽车情况(拥有或者租赁或者其他) |
Profession | 字符型 | 职业 |
CITY | 字符型 | 所在城市 |
STATE | 字符型 | 所在州 |
CURRENT_JOB_YRS | 数值型 | 在目前的工作岗位上有多年的经验 |
CURRENT_HOUSE_YRS | 数值型 | 在当前居所居住的年数 |
Risk_Flag | 数值型 | 拖欠贷款(0表示没有拖欠,1表示拖欠) |