决策树分类算法（if-else原理）

时间：2024-07-28 18:25:36浏览次数：14

决策树算法在“决策”领域有着广泛的应用，比如个人决策、公司管理决策等。其实更准确的来讲，决策树算法算是一类算法，这类算法逻辑模型以“树形结构”呈现，因此它比较容易理解，并不是很复杂，我们可以清楚的掌握分类过程中的每一个细节。

if-else原理

想要认识“决策树算法”我们不妨从最简单的“if - else原理”出发来一探究竟。作为程序员，我相信你对 if -else 原理并不感到陌生，它是条件判断的常用语句。下面简单描述一下 if -else 的用法：if 后跟判断条件，如果判断为真，也即满足条件，就执行 if 下的代码段，否则执行 else 下的代码段，因此 if-else 可以简单的理解为“如果满足条件就....，否则.....”

if-else 有两个特性：一是能够利用 if -else 进行条件判断，但需要首先给出判断条件；二是能无限嵌套，也就是在一个 if-else 的条件执行体中，能够再嵌套另外一个 if-else，从而实现无限循环嵌套。

下面我看一个简单的应用示例，相信你能从中体会到“决策树”的魅力。古人有“伯乐识别千里马”那么“伯乐”是如何“相马”的呢？下表列出了 A、B、C 、D 四匹马，它们具有以下特征：

决策树算法

如果你是“伯乐”会如何从中挑选出那匹“千里马”呢？毫无疑问，我们要根据马匹的相应特征去判断，而这些特征对应的值叫做“特征维度值”，下面是一位“伯乐”利用 if -else 原理，最终成功的审识别出“千里马”的全过程，如下所示：

决策树算法

图1：决策树流程图

上图 1 所示是一颗典型的树形结构“二叉树”，而决策树一词中的“树”指的就是这棵树。上图展示了伯乐“识别”千里马的全过程，根据特征值的有无（if-else原理）最终找出“千里马。你可能会问为什么并没囊括所有的特征值？

这是因为某些特征值对于结果的判断而言，并不是最为关键的特征值，比如马的“体型”，“骨瘦如柴”并不能决定某一匹马不是“千里马”。而“马腿”的长短没有作为判断条件，这是因为使用前三个特征值就已经完成了结果的分类，如果此时再使用“马腿”长短作为判断条件，则有点多此一举。

如果将上述判断的流程用 if-else 的伪代码写出来，如下所示：

if (特征值"声音"为"是"):

    if(特征值"眼睛有神"为"是"):

        if (特征值"马蹄大"为"是"):
            类别千里马 C

        else:
            类别普通马匹 D

    else:
        类别普通马匹 A

else:
    类别普通马匹 B

决策树算法关键

了解了“if-else”原理，下面我们进一步认识决策树算法。决策树算法涉及了几个重要的知识点：“决策树的分类方法”，“分支节点划分问题”以及“纯度的概念”。当然在学习过程中还会涉及到“信息熵”、“信息增益”、“基尼指数”的概念，相关知识在后面会逐一介绍。

特征维度&判别条件

我们知道分类问题的数据集由许多样本构成，而每个样本数据又会有多个特征维度，比如前面例子中马的“声音”，“眼睛”都属于特征维度，在决策算法中这些特征维度属于一个集合，称为“特征维度集”。数据样本的特征维度与最终样本的分类都可能存在着某种关联，因此决策树的判别条件将从特征维度集中产生。

在机器学习中，决策树算法是一种有监督的分类算法，我们知道机器学习其实主要完成两件事，一个是模型的训练与测试，另外一个是预测数据的（分类问题，预测类别），因此对于决策树算法而言，我们要考虑如何学会自动选择最合适的判别条件，如图 1 所示，只利用前三个特征就完成了分类的预测。

标签：千里马,特征值,else,算法,维度,决策树
From： https://blog.csdn.net/weixin_66519663/article/details/140707727

算法-排序算法
一、算法和算法分析什么是算法：对特定问题的求解步骤的一种描述，它是指令的有限序列，其中每一条指令表示一个或多个操作。算法的五个重要特性：有穷性确定性可行性输入输出算法设计的要求：正确性可读性健壮性高效率与低存储算法效率的度量：算法的执行时间需要依......
CSP-S提高组数据结构算法模板大合集
CSP-S算法总结2.2.1基础知识与编程环境无2.2.2C++程序设计2set/nultisetmap/multimapdeque/priority_queueSTL2.2.3数据结构P1886 滑动窗口/【模板】单调队列#include<iostream>usingnamespacestd;intn,k,a[1000005];intq[1000005],h,t;......
C++和R穿刺针吸活检肿瘤算法模型模拟和进化动力学量化差异模型
......
从零开始学数据结构系列之第四章《克鲁斯卡尔算法应用场景-公交站问题》
文章目录往期回顾某城市新增7个站点(A,B,C,D,E,F,G)，现在需要修路把7个站点连通各个站点的距离用边线表示(权)，比如A–B距离12公里问：如何修路保证各个站点都能连通，并且总的修建公路总里程最短?以上图为例，来对克鲁斯卡尔进行演示(假设用数组R保存......
ssy暑假集训暴力算法学习笔记
7.28集训第六天今天t大学的学长peop1e来给我们讲课啦！人好帅呀嘿嘿嘿....内容如下模拟退火：定义模拟退火可以分成两个部分，一个是"模拟"，一个是"退火"，先介绍什么叫退火，贴一张百度百科的图吧：\(\\\)那这"退火"的定义有啥用吗？模拟退火就是用来模拟整个退火的过程(其实没啥相似......
算法笔记|Day10栈与队列II
算法笔记|Day10栈与队列II☆☆☆☆☆leetcode150.逆波兰表达式求值题目分析代码☆☆☆☆☆leetcode239.滑动窗口最大值题目分析代码☆☆☆☆☆leetcode347.前K个高频元素（待补充）题目分析代码☆☆☆☆☆leetcode150.逆波兰表达式求值题目链接：leetcode150.......
算法笔记|Day9栈与队列
算法笔记|Day9栈与队列☆☆☆☆☆leetcode232.用栈实现队列题目分析代码☆☆☆☆☆leetcode225.用队列实现栈题目分析代码☆☆☆☆☆leetcode20.有效的括号题目分析代码☆☆☆☆☆leetcode1047.删除字符串中的所有相邻重复项题目分析代码☆☆☆☆☆leetcod......
java的几种算法结构
顺序结构1.java的最基本的结构就是顺序结构除非特别指明,否则就按照顺序一句一句执行2.顺序结构是最简单的算法结构3.语句与语句之间.框与框之间是按从上到下的顺序进行的,他是由若干个依次执行的处理步骤组成的,它是任何算法的离不开的一种基本算法结构选择结构if单选择结构......
代码随想录算法训练营第25天 | 回溯问题完结
2024年7月27日题46.全排列继续回溯。classSolution{List<List<Integer>>res;List<Integer>path;int[]used;int[]nums;publicList<List<Integer>>permute(int[]nums){//用一个used存//0表示还没有用，1表示用了......
3次样条轨迹曲线算法推导(博途SCL完整源代码)
理解3次样条插值之前，大家需要先理解3次多项式轨迹，3次多项式轨迹介绍请参考下面文章链接：3次多项式轨迹规划(PLCSCL代码)_plc按照时间轨迹规划-CSDN博客文章浏览阅读741次。机器人、运动控制等常用的轨迹规划有三次多项式、五次多项式、梯形速度规划，S型速度规划，今天我们主要介......

决策树分类算法（if-else原理）

if-else原理

决策树算法关键

特征维度&判别条件

相关文章

赞助商

阅读排行