首页 > 其他分享 >ML-集成学习

ML-集成学习

时间:2023-04-28 14:33:56浏览次数:33  
标签:集成 Bagging Gradient ML 学习 算法 AdaBoost Boosting

集成学习根据个体学习器的生成方式分为BaggingBoosting两大类。

Bagging的个体学习器之间不存在强依赖关系,Boosting存在强依赖关系。

Bagging可以同时生成的并行化方法,Boosting必须串行化生成的序列化方法。

Bagging

Bootstrap aggregating,即使用自主采样法来构造基学习器。

Bagging有两个要求:1 多样性要求指个体学习器应尽可能独立;2 准确性要求指个体学习器不能太差。

自主采样法的特点是,每个样本有0.368的概率无法被采样到,这部分剩余样本可以用于验证集的包外估计,例如决策树的剪枝、神经网络的early stop。

Bagging的训练复杂度与训练基学习器的复杂度同阶。Bagging可以直接用于多分类、回归等任务。

Bagging要求基学习器在数据集上较小的扰动可以使分类结果产生显著的变动,如此得到的基分类器之间的差异性较大。

Bagging的案例有:Random Forest 随机森林,以决策树为基学习器。RF的训练效率比Bagging更好,因为Bagging在属性划分的时候要考察节点的所有属性,而随机森林只需要随即考察一个属性子集。

Boosting

什么是强可学习与弱可学习?强可学习是指一个概念存在一个多项式的学习算法可以学习并且正确率很高;弱可学习指一个概念存在一个多项式学习算法能够学习但是正确率仅比随机猜测略好。Boosting方法就是一族可以把弱学习器提升为强学习器的算法。

Boosting的案例有:

AdaBoost:是一个加法模型,损失函数为指数函数(对一般的损失函数不适用),学习算法为前向分步算法,是一个二分类学习方法。

AdaBoost每一个步骤的新模型都是基于前一个模型的表现结果进行调整的。

Gradient在函数空间沿着负梯度方向选取弱学习器来优化损失函数,适用于任意可以微分的损失函数。

AdaBoost是Gradient Boosting的特例,Gradient Boost是AdaBoost的推广。AdaBoost是通过提升错分数据点的权重来定位模型的不足。Gradient Boost是通过梯度来定位模型的不足,因此Gradient Boosting可以使用更多种类的目标函数。

标签:集成,Bagging,Gradient,ML,学习,算法,AdaBoost,Boosting
From: https://www.cnblogs.com/zhaoke271828/p/17361955.html

相关文章

  • python学习中用到的网站
    清华大学开源软件镜像站,安装第三方模块时使用:pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplesome-package编程胶囊:https://codejiaonang.com/#/(学习正则表达式时)正则表达式的在线工具:https://regexr-cn.com/C语言中文网:http://c.biancheng.net/菜鸟教程:https://ww......
  • API 架构风格演化史:CORBA-XMLRPC(SOAP)-REST-JSONRPC-GraphQL-gRPC
    我们先来看一张 TwitterArchitecture2022CodeFirstv.sAPIFirst软件开发理念的改变下图显示了代码优先开发和API优先开发之间的差异。为什么我们要考虑API优先设计?微服务增加了系统的复杂性。我们有单独的服务来服务系统的不同功能。尽管这种体系结构促进了职责的脱钩和分......
  • 前端学习文档记录
    没有特意总结,只是将自己看到的觉得比较好的文档记录一下,方便下次以后学习(持续更新中……)  Linux基础知识总结一: Express框架 这个学着更舒服https://www.expressjs.com.cn/4x/api.html#res.append 官方文档JShttps://developer.mozilla.org/zh-CN/docs/Web/JavaScriptjqueryd......
  • 【学习总结】Jenkins小白入门
    参考链接:W3Cschool:Jenkins中文文档知乎:Jenkins详细教程知乎:jenkins入门教程(上)博客园:Jenkins自动化部署入门详细教程TBD......
  • esp32 墨水屏 html 上位机程序 传图
    使用esp32开发墨水屏显示图片这里的墨水屏工具为我自己制作的,使用esp32c3和2.9寸墨水屏,你如果使用的是自己的,请更换墨水屏驱动代码,引脚定义和图片尺寸在之前的demo演示中,我展示了使用esp32c3配合墨水屏展示HelloWorld!的一个程序。有朋友问我,墨水屏可以展示图片......
  • 基于机器学习的纠错系统技术 - 智能文本纠错 API
    引言在过去的几十年里,文本纠错技术已经取得了巨大的进展,从最初的基于规则的纠错系统到现在的基于机器学习的纠错系统,技术的发展已经帮助人们解决了大量的文本纠错问题,随着机器学习技术的发展,文本纠错技术也发生了重大变化。本文将介绍一款新的基于机器学习的纠错技术,并详细列出......
  • SeaTunnel 集成工具(大数据)
    目录一、什么是数据集成?二、ETL又是什么?三、SeaTunnel介绍1)概述2)SeaTunnel的作用3)SeaTunnel的特点4)Seatunnel优势与缺点5)核心理念四、架构演进五、相关竞品及对比六、SeaTunnel部署和简单使用1)安装JDK2)下载3)安装接器插件4)快速开始5)快速开始使用Flin......
  • 集成学习:Bagging & Boosting
    核心思想将多个弱分类器组装成一个强分类器。前置知识Bias&Variance定义:$bias=\bar{f}(x)-y$,为模型的期望预测与真实值之间的差异。$variance=\mathbb{E}_{\mathcal{D}}[(f(x;\mathcal{D})-\bar{f}(x))^2]$,模型在数据集\(\mathcal{D}\)上的鲁棒性。Bagging(bo......
  • 网页截图,html2canvas简单示例
     <divid="box"><p>asd4a5s6fa6s5f1asf</p><imgstyle="width:200px"src="xxxxxx.png"/><buttonstyle="width:100px;height:30px"onclick="prtsc()">pr......
  • 从零开始构建HTML 5 Web页面
    HTML5是时下Web开发领域炒得火热的一个术语,是的,很多人都看好它,也有很多业内知名公司开始正式使用HTML5重新构建自己的网站,如YouTube开始使用HTML5视频,Google已经弃用自家的Gears,开始全面拥抱HTML5实现离线解决方案,各大浏览器厂家也纷纷开始支持HTML5,连被人诟病的微软也声称要......