特征相关性矩阵,实验的基础
结论1:对于lgb,特征相关性越高,损失肯定越低
结论2:对于lgb,特征相关性正负作用是相同的,相关性=+0.76和相关性= -0.76完全相同
结论三:看红色文字,lgb有能力发现非线性特征的作用
结论四:x6和y的相关性最高,x2最低。但x2和x6的相关性是最低的,起到一定互补作用。在添加了x6的同时,如果额外添加一个特征的话,选x2反而更佳
结论五:将相关性最高和最低的同类型特征加入后,是否加入中间特征几乎不影响结果,即使将中间特征全部加入后,也能达到最佳结果
筛选特征实操总结:
1 要交叉验证,结果才靠谱,才能说明结论正确
2 打印出corr矩阵
3 排序每个特征和y的相关性,给个阈值,低于阈值且和其它任何特征相关性都低的特征可视为噪音,可删除,其它全部保留
标签:结论,方法论,lightgbm,特征,lgb,相关性,x2,筛选,x6 From: https://www.cnblogs.com/chentianyu/p/18125648