一、算法概念

什么是梯度提升决策树?
梯度提升决策树（Gradient Boosting Decison Tree）是集成学习中Boosting家族的一员。
在这里插入图片描述

集成学习(ensemble learning)是一种通过组合多个基学习器（模型）来提高整体预测性能的方法。它通过集成多个学习器形成一个强学习器，从而提高模型的泛化能力和准确性。集成学习的核心思想是利用不同模型的组合弥补单一模型的缺点。集成学习可以分为两大类，一类是序列化方法：个体学习器之间存在强依赖关系，必须串行生成，例如boosting；一类是并行化方法：个体学习器之间不存在强依赖关系、可以同时生成，例如bagging（也称为bootstrap聚合）。
Boosting类算法中最著名的代表是Adaboost算法，Adaboost的原理是，通过前一轮弱学习器的错误率来更新训练样本的权重，不断迭代提升模型性能。
GBDT与传统的Adaboost算法有显著不同，GBDT同样通过迭代来提升模型的表现，但它采用的是前向分布算法（Forward Stagewise Algorithm），且其弱学习器被限定为CART回归树。此外，GBDT的迭代思想和Adaboost也有所区别。GBDT算法流程如下：
在这里插入图片描述

一、算法原理

（一） GBDT 及负梯度拟合原理

GBDT（Gradient Boosting Decision Tree）是一种利用多个决策树来解决分类和回归问题的集成学习算法。核心思想是通过前一轮模型的残差来构建新的决策树。为了提高拟合效果，Friedman 提出了用损失函数的负梯度来近似残差，从而拟合一个新的CART回归树，负梯度的表示公式为：
$$r_{t,i} = -\left[\frac{\partial L(y_i, f(x_i))}{\partial f(x_i)}\right]{f(x) = f(x)}$$
其中，$r_{t,i}$表示的是第

标签：函数,模型,损失,test,GBDT,Sentosa,DSML
From： https://www.cnblogs.com/KennethYuen/p/18466877

【机器学习(七)】分类和回归任务-K-近邻 (KNN)算法-Sentosa_DSML社区版
@目录一、算法概念二、算法原理（一）K值选择（二）距离度量1、欧式距离2、曼哈顿距离3、闵可夫斯基距离（三）决策规则1、分类决策规则2、回归决策规则三、算法优缺点优点缺点四、KNN分类任务实现对比（一）数据加载和样本分区1、Python代码2、Sentosa_DSML社区版（二）训练模型1、Python代码2、Sento......
【机器学习(六)】分类和回归任务-LightGBM算法-Sentosa_DSML社区版
@目录一、算法概念二、算法原理（一）Histogram（二）GOSS1、信息增益2、近似误差（三）EFB三、算法优缺点（一）优点（二）缺点四、LightGBM分类任务实现对比（一）数据加载和样本分区1、Python代码2、Sentosa_DSML社区版（二）模型训练1、Python代码2、Sentosa_DSML社区版（三）模型评估和模型可视化1、Python代......
【机器学习(十)】时间序列—Holt-Winters方法—Sentosa_DSML社区版
@目录一、Holt-Winters算法原理(一)加法模型(一)乘法模型(三)阻尼趋势二、HoltWinters算法优缺点优点缺点三、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入和统计分析(二)数据预处理(三)模型训练和模型评估(四)模型可视化四、总结一、Holt-Winters算法原理......
【机器学习(九)】分类和回归任务-多层感知机 (MLP) -Sentosa_DSML社区版
@目录一、算法概念二、算法原理（一）感知机（二）多层感知机1、隐藏层2、激活函数sigma函数tanh函数ReLU函数3、反向传播算法三、算法优缺点（一）优点（二）缺点四、MLP分类任务实现对比（一）数据加载和样本分区1、Python代码2、Sentosa_DSML社区版（二）模型训练1、Python代码2、Sentosa_DSML社区版（三）......
【机器学习(八)】分类和回归任务-因子分解机(Factorization Machines,FM)-Sentosa_DSM
@目录一、算法概念二、算法原理（一）FM表达式（二）时间复杂度（三）回归和分类三、算法优缺点（一）优点（二）缺点四、FM分类任务实现对比（一）数据加载和样本分区1、Python代码2、Sentosa_DSML社区版（二）模型训练1、Python代码2、Sentosa_DSML社区版（三）模型评估和模型可视化1、Python代码2、Sentosa_DSM......
【机器学习(十一)】糖尿病数据集分类预测案例分析—XGBoost分类算法—Sentosa_DSML社
@目录一、XGBoost算法二、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入和统计分析(二)数据预处理(三)模型训练与评估(四)模型可视化三、总结一、XGBoost算法关于集成学习中的XGBoost算法原理，已经进行了介绍与总结，相关内容可参考【机器学习(一)】分类和回归任务......
【机器学习(十三)】机器学习回归案例之股票价格预测分析—Sentosa_DSML社区版
@目录一、背景描述二、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入(二)特征工程(三)样本分区(四)模型训练和评估(五)模型可视化三、总结一、背景描述股票价格是一种不稳定的时间序列,受多种因素的影响。影响股市的外部因素很多,主要有经济因素、政治因素......
【机器学习(十二)】机器学习回归案例之二手汽车价格预测—XGBoost回归算法—Sentosa_D
@目录一、算法和背景介绍二、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入与统计分析(二)数据处理(三)特征选择与相关性分析(四)样本分区与模型训练(五)模型评估和模型可视化三、总结一、算法和背景介绍关于XGBoost的算法原理，已经进行了介绍与总结，相关内容......
【机器学习(十三)】机器学习回归案例之股票价格预测分析—Sentosa_DSML社区版
文章目录一、背景描述二、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入(二)特征工程(三)样本分区(四)模型训练和评估(五)模型可视化三、总结一、背景描述股票价格是一种不稳定的时间序列,受多种因素的影响。影响股市的外部因素很多,主要有经济......
【机器学习(十)】时间序列案例之月销量预测分析—Holt-Winters算法—Sentosa_DSML社区
文章目录一、Holt-Winters算法原理(一)加法模型(二)乘法模型(三)阻尼趋势二、HoltWinters算法优缺点优点缺点三、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入和统计分析(二)数据预处理(三)模型训练和模型评估(四)模型可视化四、总结一、Holt-......

【机器学习(四)】分类和回归任务-梯度提升决策树(GBDT)-Sentosa_DSML社区版

一、算法概念

一、算法原理

（一） GBDT 及负梯度拟合原理

相关文章

赞助商

阅读排行