作者:王茂霖,华中科技大学,Datawhale成员
内容概括
1.经典特征工程构造
2.特征工程案例实践
PPT完整下载:后台回复“210501”可获取
视频地址:https://www.bilibili.com/video/BV1sf4y1s7Fw
特征工程构造
特征工程是数据科学最有创造力的部分
一、特征的类型汇总
二、特征工程方法总结
三、类别特征的常用编码方法
1.Label Encoder
2.One-Hot Encoder
3.Frequency 编码
4.Target 编码
5.其他编码
四、数值特征的常用编码方法
五、时间特征的常用编码方法
特征工程实践
1.特征构造
特征工程构建大概可以从三个方面入手:领域特征,交叉特征和多项式特征。
2.特征选择
特征选择可能会降低模型的预测能力。因为被剔除的特征中可能包含了有效的信息,抛弃了这部分信息会一定程度上降低预测准确率。
本文作者
王茂霖,Datawhale重要贡献成员,Datawhale&天池数据挖掘学习赛开源内容发起人,全网阅读超10w。
参赛30余次,获得DCIC-数字中国创新创业大赛亚军,全球城市计算AI挑战赛,Alibaba Cloud German AI Challenge等多项Top10。
分享地址
- 复制链接打开(或阅读原文)
- https://www.bilibili.com/video/BV1sf4y1s7Fw