首页 > 其他分享 >机器学习Day4

机器学习Day4

时间:2024-06-23 10:27:24浏览次数:3  
标签:剪枝 结点 机器 纯度 Day4 学习 为叶 节点 决策树

决策树

1.概念

决策树是一种用于解决分类问题的算法,希望通过从给定数据训练一个模型用来对新示例进行分类
决策树顾名思义是树结构,其结点可以划分为三类:根结点、内部结点、叶结点
根节点:一般是区分度最高(基尼指数最小)的属性(纯度最高)
内部结点:是父结点下基尼系数最小的结点
叶结点:决策结点,一般为标签的值

2.划分选择

我们希望决策树的分支结点所包含的样本尽可能属于同一类别,即纯度
常用方法:
1.信息熵:值越小,纯度越高
在这里插入图片描述
2.基尼指数:值越小,纯度越高
在这里插入图片描述

3.剪枝处理

剪枝是决策树学习算法中降低过拟合的主要方法
基本策略:
1.预剪枝:在决策树生成过程中对每个结点先进行估计,若当前结点的划分不能带来决策树泛化性能的提升,则停止划分并将当前结点标记为叶节点(自顶向下)

2.后剪枝:从训练集生成一棵完整的决策树,自底向上对非叶节点进行考察,若将该节点对应的子树替换为叶节点能带来决策树泛化性能提升,则将该子树替换为叶结点

4.连续离散

将连续值划分为几个区间,区间的分界值相同

标签:剪枝,结点,机器,纯度,Day4,学习,为叶,节点,决策树
From: https://blog.csdn.net/weixin_52108189/article/details/139896478

相关文章

  • 【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+Tenso
    一、介绍昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂','甲虫','蝴蝶','蝉','蜻蜓','蚱蜢','蛾','蝎子','蜗牛','蜘蛛')进行训练,得到一个识别精度较......
  • 机器学习各个算法的优缺点!(上篇) 建议收藏。
      下篇地址:机器学习各个算法的优缺点!(下篇)建议收藏。-CSDN博客.......纯干货..........回归正则化算法集成算法决策树算法支持向量机降维算法聚类算法贝叶斯算法人工神经网络深度学习感兴趣的朋友可以点赞、转发起来,让更多的朋......
  • AI职场写作|为你所做的学习过滤,入门与进阶
    GPT的使用门槛已经变得越来越低,之前文章中推荐的2款GPT零成本应用平台,已经不需要考虑网络、成本问题了。学会跟GPT对话,是一项要尽快掌握的技能。未来最快实现的,可能不是AI取代我们,而是不会使用AI的人,逐渐被懂得使用AI的人所取代。在未来,各种AI的应用,在使用上,肯定会变......
  • Python vs MATLAB: 易于学习和代码可理解性的对比
    PythonvsMATLABPythonvsMATLAB:易于学习和代码可理解性**Python的易用性与代码理解****MATLAB的易用性与代码理解****哪个更易上手?****结论**PythonvsMATLAB:易于学习和代码可理解性在科学计算、工程模拟和数据分析领域,Python和MATLAB是两种广泛使用的编程......
  • 从零开始学习树莓派(一)
    准备工作树莓派的型号:RaspberryPiZero2w(自带的其他配件:亚克力外壳,HDMI线,GPIO拓展套件,Micro电源,32G内存卡,读卡器,散热片)(一)烧录系统首先,使用官方的软件进行烧录操作,RaspberryPiImager准备一张内存卡,按照步骤依次进行配置,其中还需要配置最后等待一段时间即可。中间有些需......
  • 【图文】BP神经网络与深度学习CNN的关系
    本文来自《老饼讲解-BP神经网络》https://www.bbbdata.com/目录一、BP神经网络网络是什么二、BP神经网络用于图象识别问题1.1.BP神经网络解决图象识别问题1.2.BP神经网络解决图象识别问题的困难三、从BP到CNN深度学习模型BP神经网络是一个经典、有效的算法,即使时至今日,在传统......
  • 大模型基本概念学习 - Checkpoint、PyTorch、 TensorFlow、Transformers、ModelScope
    文章目录前言一、checkpoint二、TensorFlow1.简介2.主要特点3.示例代码三、PyTorch1.简介2.主要特点3.示例代码四、TensorFlow和PyTorch区别五、Transformers六、Transformers通过配置或自动检测来决定使用PyTorch或TensorFlow1.自动检测2.通过环境变量配......
  • 线段树进阶 学习笔记
    线段树合并学习笔记线段树分治P5787考虑怎么判断二分图。先考虑弱化的版本。不考虑删边加边,则可以直接黑白染色。考虑只加边,不删边,分类讨论:注意到对于同一个连通块,一共只有两种染色方式。加的边在两个连通块之间,一定是Yes,并确定了两个连通块的染色方案。加的边在连通......
  • RSpromoter:基于视觉模型的遥感实例分割提示学习
    RSpromoter:基于视觉模型的遥感实例分割提示学习摘要-利用来自SA-1B的大量训练数据,分段任意模型(SAM)展示了显著的泛化和零样本能力。然而,作为一种与类别无关的实例分割方法,SAM在很大程度上依赖于先前的手动指导,包括点、框和粗粒度掩码。此外,它在遥感图像分割任务中的性能在很大程度......
  • Python编程学习进阶书籍
    1、Python编程从入门到实践第2版本书内容分为“基础知识”和“项目”两部分。读完本书,读者不仅能快速掌握编程基础知识,还能编写出解决实际问题的代码并开发复杂的项目。第2版沿袭第1版讲解清晰透彻、循序渐进的特点,并全面升级。第一部分“基础知识”新增SublimeText、f字符......