决策树剪枝

决策树剪枝

时间：2022-11-27 23:00:41浏览次数：41

剪枝处理
首先剪枝（pruning）的目的是为了避免决策树模型的过拟合。因为决策树算法在学习的过程中为了尽可能的正确的分类训练样本，不停地对结点进行划分，因此这会导致整棵树的分支过多，也就导致了过拟合。决策树的剪枝策略最基本的有两种：预剪枝和后剪枝：

预剪枝（pre-pruning）：预剪枝就是在构造决策树的过程中，先对每个结点在划分前进行估计，若果当前结点的划分不能带来决策树模型泛华性能的提升，则不对当前结点进行划分并且将当前结点标记为叶结点。
后剪枝（post-pruning）：后剪枝就是先把整颗决策树构造完毕，然后自底向上的对非叶结点进行考察，若将该结点对应的子树换为叶结点能够带来泛华性能的提升，则把该子树替换为叶结点。
预剪枝：
在决策树生成的过程中，每个决策节点原本是按照信息增益、信息增益率或者基尼指数等纯度指标，按照值越大，优先级越高来排布节点。由于预剪枝操作，所以对每个节点在划分之前要对节点进行是否剪枝判断，即：使用验证集按照该节点的划分规则得出结果。若验证集精度提升，则不进行裁剪，划分得以确定；若验证集精度不变或者下降，则进行裁剪，并将当前节点标记为叶子节点。
数据集采用上次的数据集
dataSet = [[1,1,1,'yes'],
[1,1,0,'yes'],
[1,0,0,'no'],
[1,0,1,'yes'],
[0,1,1,'yes'],
[0,1,0,'no'],
[0,0,0,'no'],
[0,0,1,'no']]
labels = ['money','eating','felling']
构造预剪枝

预剪枝后的树

预剪枝不必生成整棵决策树，且算法相对简单，效率很高，适合解决大规模问题。但是尽管这一方法看起来很直接，但是怎样精确地估计何时停止树的增长是相当困难的。
预剪枝还有一个缺点，在相同的标准下，也许当前的扩展会造成过度拟合训练数据，但是更进一步的扩展能够满足要求，也有可能准确地拟合训练数据。这将使得算法过早地停止决策树的构造。
构造后剪枝

后剪枝的树

标签：剪枝,结点,no,yes,节点,决策树
From： https://www.cnblogs.com/liuminghao2/p/16930949.html

决策树的剪枝
一.决策树是一种分类器，通过ID3，C4.5和CART等算法可以通过训练数据构建一个决策树。但是，算法生成的决策树非常详细并且庞大，每个属性都被详细地加以考虑，决策树的树叶节点所覆......
决策树——预剪枝
决策树的剪枝有两种思路：1.预剪枝2.后剪枝预剪枝预剪枝就是在构造决策树的过程中，先对每个结点在划分前进行估计，如果当前结点的划分不能带来决策树模型泛化性能的提升，则......
sklearn 决策树算法
https://cloud.tencent.com/developer/article/1819247主要阐述sklearn中分类决策树(tree.DecisionTreeClassifier)的参数，回归决策树类似，不再赘述。DecisionTreeClassif......
leetcode814. 二叉树剪枝。如果想到使用递归还是很简单的
814.二叉树剪枝有一点疑问，为什么不能先 if(!root->left&&!root->right&&root->val==0)returnnullptr; ？classSolution{public:TreeNode......
决策树剪枝
一、为什么要进行剪枝？当我们的数据集样本量很大、每个特征的取值很多时，生成决策树的代价就会很大。不仅如此，虽然一个完整的决策树对训练数据的预测非常准，但这会造成对训练......
决策树剪枝
一、决策树剪枝1.目的剪枝（pruning）是决策树学习算法解决过拟合问题的主要手段。在决策树学习中，为了尽可能正确分类训练样本，节点划分过程将不断重复，有时会造成决......
决策树（二）：后剪枝，连续值处理，数据加载器：DataLoader和模型评估
在上一篇文章中，我们实现了树的构造，在下面的内容中，我们将中心放在以下几个方面1.剪枝2.连续值处理3.数据加载器：DataLoader4.模型评估一，后剪枝•为什么剪枝 –......
337. 打家劫舍 III ----- 动态规划、递归、剪枝、分类讨论
小偷又发现了一个新的可行窃的地区。这个地区只有一个入口，我们称之为 root 。除了 root 之外，每栋房子有且只有一个“父“房子与之相连。一番侦察之后，聪明的小偷意识到......
决策树
一.什么是决策树决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。......
R语言Apriori关联规则、kmeans聚类、决策树挖掘研究京东商城网络购物用户行为数据可视
全文链接：http://tecdat.cn/?p=30360原文出处：拓端数据部落公众号随着网络的迅速发展，依托于网络的购物作为一种新型的消费方式，在全国乃至全球范围内飞速发展。电子商务成为......

相关文章

赞助商

阅读排行