首页 > 其他分享 >【AL&MT】Decision Tree

【AL&MT】Decision Tree

时间:2023-08-26 22:22:58浏览次数:38  
标签:frac decision tree Decision Tree MT Ent Gain sum

1 Introduction

  usual class in decision tree:ID3,C4.5,CART

  ID3:/Informattion Entropy,基于信息熵和信息增益

  C4.5:/信息增益率,base on the ID3

  CART:/基尼系数,using regress or class

2 achieving

  1.1 ID3 decision tree

  D-training set,a-attribute

  $input:a=\{a^{1},a^{2},...,a^{v}\}$

  $output:Gain(D,a)$

  model:

  $p_{i}:the\ i\ sample\ take\ part\ in\ the\ D$

  $Ent(D)=-\sum_{i=1}^{\|n\|}p_{i}log_{2}p_{i}$

  $Ent(D|a)=\sum^{V}_{v=1}\frac{|D^{v}|}{D}Ent(D^{v})$

  $Information\ Gain:Gain(D,a)=Ent(D)-Ent(D|a)$

  chosing the max of vartex of Gain

  1.2 C4.5 decision tree

  defect of id3:when the class of sample are overmach,it's class less precison.

  base on the Intrinsic Value

  $Gain:Gain(D,a)=Ent(D)-Ent(D|a)$

  $intrinsic\ value\ of\ a:$

  $IV(a)=-\sum^{V}_{v=1}\frac{|D^{v}|}{|D|}log_{2}\frac{|D^{v}|}{|D|}$

  $GainRatio(D,a)=\frac{Gain(D,a)}{IV(a)}$

  1.3 CART decision tree

  CART(Classification and regression tree),using the Gini index todevide sample.

  sklearn model in 'python' using cart mathods

  -Classification tree:aimed data divide or scatter

  -Regression tree:aimed data continuous

  $Gini(D)=-\sum^{|n|}_{i=1}\sum_{i'={i}}p_{i}^{i'}=1-\sum^{|n|}_{i=1}p^{2}_{i}$

  $GiniIndex(D,a)=-\sum^{V}_{v=1}\frac{|D^{v}|}{|D|}Gini(D^{v})$

3 sample

  T餐饮企业作为大型的连锁企业,生产的产品种类比较多,另外涉及的分店所处的位置也不同、数目比较多。对于企业的高层来讲,了解周末非周末销量是否有大的区别,以及天气、促销活动等因素是否能够影响门店的销量,对采取合理的营销策略,提高企业利润非常重要。因此,为了让决策者准确地了解和销量有关的一系列影响因素,需要构建模型来分析天气、是否周末和是否有促销等活动对其销量的影响。各属性的取值如下:

4 code

...

5 problem

...

标签:frac,decision,tree,Decision,Tree,MT,Ent,Gain,sum
From: https://www.cnblogs.com/TangBao111/p/17659559.html

相关文章

  • 开源.NetCore通用工具库Xmtool使用连载 - XML操作篇
    【Github源码】《上一篇》介绍了Xmtool工具库中的发送短信类库,今天我们继续为大家介绍其中的XML操作类库。XML操作是软件开发过程中经常会遇到的情况;包括XML内容的遍历解析,或者特定值内容的查询获取等等。Xmtool工具库提供了一种更方便的方式对Xml进行遍历解析或者对特定节点内......
  • 安卓主板定制_电磁屏/电容屏安卓平板基于MTK联发科方案定制
    定制化行业平板在各行各业中的地位越来越重要,甚至在行业转型和发展中发挥着不可替代的作用。随着工业化社会的快速发展,工业生产对智控设备要求越来越高,运用的范畴也越来越普遍广泛,工业级平板就是其中一种应用广泛的设备。新移科技专注于行业安卓平板定制开发,联发科紫光展锐高通......
  • CF1858D Trees and Segments
    一道考查预处理技巧的dp。观察式子\(a\timesL_0+L_1\),一个显然的想法是“定一求一”,即预处理求出对于每个\(L_1\)最大的\(L_0\),然后对于每个\(a\),枚举\(L_1\),统计最大的\(a\timesL_0+L_1\)。这样,我们将问题转化为了:已知\(L_1=len\),求出\(dp_{len}=L_{0max}\)。dp数......
  • CodeForces 825G Tree Queries
    洛谷传送门CF传送门模拟赛赛时做法。看到查询路径点权最小值,想到建重构树,满足重构树上\(\operatorname{LCA}(x,y)\)为原树上\(x\toy\)路径的点权最小值。建树方法可以参考CF1797FLiHuaandPath。于是问题变成了,维护一个点集,支持加点,查询给定点\(x\)到点集中所有......
  • [CF1794E] Labeling the Tree with Distances 题解
    [CF1794E]LabelingtheTreewithDistances题解题目描述给你一个树,边权为\(1\)。给定\(n-1\)个数,你需要将这些数分配到\(n-1\)个节点上。一个点\(x\)是好的,当且仅当存在一种分配方案,所有被分配数的点到\(x\)的最短路径长度等于其被分配的数。求所有好点。思路从......
  • P3521 [POI2011] ROT-Tree Rotations
    P3521[POI2011]ROT-TreeRotations首先合并两棵子树的时候只关心子树内值的个数,并不关心子树内具体是什么顺序,引导从下向上线段树合并计算代价。每一个值只会出现一次,首先每个叶子节点开一棵动态开点值域为\(1-n\)的线段树维护,初始只有自己的值的位置为\(1\)。然后对于每......
  • git_使用git worktree命令使不同分支的代码文件可以同步运行
    情景再现:我本地代码正在开发后台系统的过程中,前台开发的同事时不时地会来找我要IP地址,使用正在开发的后台管理系统来进行一些数据的增删改查.这个时候直接提供正在开发的版本的开发服务器地址是不行的,因为随着代码的编写时不时的报个bug是家常便饭,对于使用者来说非常......
  • 开源.NetCore通用工具库Xmtool使用连载 - 发送短信篇
    【Github源码】《上一篇》介绍了Xmtool工具库中的发送邮件类库,今天我们继续为大家介绍其中的发送短信类库。发送短信就像发送邮件一样,在软件系统中使用非常普遍,甚至比发送邮件还要常见,有些甚至是软件标配功能;例如现在的短信验证码登录、通过短信找回密码等等。发送短信需要通过......
  • MT8183|MTK8183核心板 联发科MTK安卓核心板规格参数
    MT8183核心板集成了一个八核CPU,其中包括四个主频高达2GHz的ArmCortex-A73和Cortex-A53MPCoreTM,以及一个主频800MHz的功能强大的ArmMali-G72级图形处理器。这些处理器提供了支持最新的操作系统和苛刻应用程序所需的处理能力,如Web浏览、电子邮件、应用程序和服务、全球导航......
  • el-tree 折叠节点时去掉 defaultExpandedKeys 中已折叠的节点及其子节点
    问题场景树形节点默认是全部折叠的。展开节点A,再把它折叠。然后给节点B新增子节点,新增成功后刷新树,却发现节点A是展开的。原因分析树刷新后全部节点都默认是折叠的,除非defaultExpandedKeys数组中有数据(这些节点数据是展开的)。因此,只需要在折叠节点A时,在defaultExpandedKeys......