机器学习算法只接受数值输入,所以如果我们遇到分类特征的时候都会对分类特征进行编码,本文总结了常见的11个分类变量编码方法。
1、ONE HOT ENCODING
最流行且常用的编码方法是One Hot Enoding。一个具有n个观测值和d个不同值的单一变量被转换成具有n个观测值的d个二元变量,每个二元变量使用一位(0,1)进行标识。
完整文章:
https://avoid.overfit.cn/post/2ebd057b56cd4b54a666de6dd4ed6294
标签:11,编码,变量,编码方法,特征,分类 From: https://www.cnblogs.com/deephub/p/16859663.html