首先,了解一下集成学习及 Boosting 算法。集成学习归属于机器学习,他是一种“训练思路”,并不是某种具体的方法或者算法。
现实生活中,大家都知道“人多力量大”,“3 个臭皮匠顶个诸葛亮”。而集成学习的核心思路就是“人多力量大”,它并没有创造出新的算法,而是把已有的算法进行结合,从而得到更好的效果。
集成学习会挑选一些简单的基础模型进行组装,组装这些基础模型的思路主要有 2 种方法:
- bagging(bootstrap aggregating的缩写,也称作“套袋法”)
- boosting