首页 > 编程语言 >机器学习中集成学习的概念及其一些典型算法

机器学习中集成学习的概念及其一些典型算法

时间:2023-12-21 21:35:43浏览次数:26  
标签:集成 预测 模型 残差 学习 算法 预测值

1.集成学习的概念

集成学习是一种机器学习范式,在这种范式中,多个学习者被训练和组合起来一起解决同一个问题。通过使用多个学习者,就可以把整个模型的泛化能力提高很多倍

所以说,集成学习的泛化能力比单个学习者强得多得多,所以叫:“集思广益”。

2.集成学习的具体流程

  • 一个问题出来,数据集丢给若干模型进行训练,训练出若干模型
  • 所有模型汇总合成得到最好的一个模型
  • 这个模型就是集成学习训练所得结果

3.集成学习分类

分类 Bagging Boosting
方法 独立构建若干基本学习器 按顺序方式构建基本学习器
如何汇总模型 平均学习器的预测 一次预测一次拾取,每一次减少综合学习偏差
效果 方差减少了,平均下来效果通常比任何单基学习者更好 综合学习器具有很强拟合数据能力
典型算法 随机森林 GBDT,Adaboost

4.典型算法——随机森林

随机森林=Bagging+CART决策树

核心就是:构建多个决策树,平均他们的预测

如下图:

对每一个决策树都进行每一次所用来构建决策数的对应的数据子集进行预测,最终所有的预测结果进行相应的问题来做相应的操作:

  • 分类问题就对所有预测进行投票表决,票数最多的预测作为最终预测,即最终归为的那一类
  • 回归问题即取所有预测平均值作为最终结果

5.典型算法——GBDT

GBDT属于Boosting算法的一种
综合模型的结果就是所有学习器结果相加等于预测值,本质:下一个基础学习器去拟合误差函数对预测值的残差(此残差即预测值与真实值间的误差)
GBDT训练模型时,要求模型预测样本损失尽量小最好
看个例子:

如上图:

  • 要预测一个30岁的人,我们第一次预测20岁,显然差的很多,然后进行残差计算为10,对残差拟合-->预测出来为9岁;
  • 以此类推,残差=1岁,再对1岁预测-->1岁,无法继续往下了(预测正确);
  • 对右边三个预测结果加起来:20+9+1=30岁,这就跟我们放入的数据一样;

总的来说:对右边直到第一次预测成功(与上一次残差相等时)的数据从下往上求和所有预测结果,其和就是我们的真实数据。

5.最后,总结

  • 集成学习就是让一个训练集划分若干数据子集训练出多个模型,给多个模型进行预测,对预测结果取平均或最大最小等一系列操作,得到一个最终的预测值,简单地说即“集思广益”;
  • 集成学习分类:Bagging,Boosting
  • 随机森林:Bagging+决策树,核心思想:构建多个决策树,若是分类问题就进行预测结果的投票取最高票数的预测值,即所归之类,若是回归问题就进行所有预测结果取平均值;
  • GBDT,核心思想:对残差拟合,直到残差预测正确,从下往上求和所有的预测值,所有预测值之和就是真实数据的值。

标签:集成,预测,模型,残差,学习,算法,预测值
From: https://www.cnblogs.com/cyz666666/p/17920151.html

相关文章

  • 机器学习-线性分类-支持向量机SVM-SMO算法代码实现-15
    1.alpha2的修剪ify1!=y2:α1-α2=k#不用算k的具体大小ifk>0:#上图的左下这条线α2的区间(0,c-k)k<0:#上图的左下这条线α2的区间(-k,C)所以:L=max(0,-k)#k>0还是<0都统一表达了H=min(c,c-k)else:y1=y2右边的图同理2.参......
  • 2023-2024-1学期20232412《网络空间安全导论》第三周学习总结
    教材学习内容总结了解当下网络安全面临的威胁了解网络安全体系结构初步认识网络安全防护技术的种类从法律、管理层面认识网络安全认识当前新兴网络及安全技术思维导图教材学习中的问题和解决过程问题1:对开放系统互联模型的认识不够清晰解决方案:与AI模型进行苏格拉底挑......
  • Spring Boot学习随笔- 拦截器实现和配置(HandlerInterceptor、addInterceptors)、jar包
    学习视频:【编程不良人】2021年SpringBoot最新最全教程第十三章、拦截器拦截器:Interceptor拦截中断类似于javaweb中的Filter,不过没有Filter那么强大作用SpringMVC的拦截器是一种用于在请求处理过程中进行预处理和后处理的机制。拦截器可以在请求到达控制器之前和......
  • 零代码敲敲云与钉钉的完美集成,打造智能办公新生态
    为满足企业对于高效沟通、协作和工作流程管理日益增长的需求,许多企业都在寻找能够与他们现有的工作平台无缝集成的工具。钉钉作为一款广受欢迎的企业通讯和协同工具,已经成为了众多企业的首选。目前敲敲云已于钉钉完美集成,通过这次集成,用户可以在钉钉中直接使用敲敲云的零代码功能......
  • 羚通视频智能分析平台:安防视频汇聚,危险区域行人入侵算法识别与检测预警
    随着科技的不断发展,安防领域也在不断地进行创新和升级。羚通视频智能分析平台,作为一款领先的安防视频汇聚平台,凭借其强大的功能和高效的性能,已经成为了许多企业和机构的首选。本文将详细介绍羚通视频智能分析平台在危险区域行人入侵算法识别和检测预警方面的应用。一、羚通视频智......
  • 学习过程遇到的问题
    问题一:打开jupyternotebook,运行代码,不显示结果,直接跳到了下一行,[]里面什么都不显示类似这样的,当时忘记了截图,在网上找了相似的问题,借用了一下图片。经过一番寻找,最终找到了解决的方案。原因pyzmq版本太高的原因,与JupyterNotebook不兼容解决方案1.打开AancondaPrompt,输......
  • JVM内存参数的学习之三
    JVM内存参数的学习之三背景研究启动性能时,顺便看到了jmap-heap1的部分信息看到:MinHeapFreeRatio、MaxHeapFreeRatio自己突然以为是Percentage的参数,恍惚了好久.才发现自己对内存的学习不够,所以想多学习一下.参数解释MinHeapFreeRatio:空闲堆空间的最小......
  • opencv图像处理机器学习真实项目教程(python实现)3图像处理基础
    3图像处理基础在本章中,我们将介绍图像处理中的各种操作,首先是基于平移的操作,如旋转和调整大小。读者将学习如何使用OpenCV旋转和调整图像大小,以及如何控制生成图像的大小和方向。本章接着介绍了图像的算术运算,如加法、减法和除法。本章继续以图像运算为主题,介绍图像的位运算,如......
  • 《OneLLM: One Framework to Align All Modalities with Language》论文学习
    一、Abstract随着LLM的兴起,由于其强大的语言理解和推理能力,在学术和工业界中越来越受欢迎。LLM的进展也启发了研究人员将LLM作为多模态任务的接口,如视觉语言学习、音频和语音识别、视频理解等,因此多模态大语言模型(MultimodalLargeLanguageModel,MLLM)也引起了研究人员的关注......
  • 羚通视频智能分析平台:安防视频汇聚,危险区域行人入侵算法识别与检测预警
    随着科技的不断发展,安防领域也在不断地进行创新和升级。羚通视频智能分析平台,作为一款领先的安防视频汇聚平台,凭借其强大的功能和高效的性能,已经成为了许多企业和机构的首选。本文将详细介绍羚通视频智能分析平台在危险区域行人入侵算法识别和检测预警方面的应用。一、羚通视......