首页 > 编程语言 >机器学习之——决策树信息增益比计算[附加计算程序]

机器学习之——决策树信息增益比计算[附加计算程序]

时间:2024-09-02 21:25:27浏览次数:3  
标签:0.9403 outlook log2 14 play 增益 temperature 计算 决策树

0 前言

1 信息增益比计算公式

image

2 信息增益比计算

2.1 gR(play,outlook)的计算

根据信息增益(跳转)相关知识,得出:

  • 特征outlook对数据集D的信息增益g(D,outlook)就等同于g(play,outlook),这里play是最终分类的属性。
    先计算分子:g(play,outlook),有如下计算过程:
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403
    H(play|outlook)=(4.0/14)* 0.0000+(5.0/14)* 0.9710+(5.0/14)* 0.9710=0.6935
    g(play,outlook)=H(play)-H(play|outlook)=0.9403-0.6935=0.2467
    H(play)的计算方法请参考:信息熵
    H(play|outlook)的计算方法请参考:条件熵

  • 根据分母HA(D)的公式,不难看出其就是某个随机变量D的信息熵。
    故有HA(D)等同于H(D),即随机变量D的信息熵,在本例题等同于H(play)。
    计算分母:HA(D)=H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403

  • 计算gR(play,outlook)。
    根据公式gR(play,outlook)=g(play,outlook) / H(play) = 0.2467 / 0.9403=0.2624

2.2 gR(play,temperature)的计算

  • 计算分子g(play,temperature)。
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403
    H(play|temperature)=(4.0/14)* 0.8113+(4.0/14)* 1.0000+(6.0/14)* 0.9183=0.9111
    g(play,temperature)=H(play)-H(play|temperature)=0.9403-0.9111=0.0292

  • 计算分母H(play)。
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403

  • 计算gR(play,temperature)。
    gR(play,temperature)=g(play,temperature) / H(play)=0.0292 / 0.9403=0.0311

3 计算程序

程序

4 结语

如有错误请指正,禁止商用。

标签:0.9403,outlook,log2,14,play,增益,temperature,计算,决策树
From: https://www.cnblogs.com/hello-nullptr/p/18393486

相关文章

  • [20240902]验证sql_idz.sh计算PLSQL代码块.txt
    [20240902]验证sql_idz.sh计算PLSQL代码块.txt--//测试验证sql_idz.sh计算PLSQL代码块是否正确.1.环境:SYS@book>@ver2==============================PORT_STRING                  :x86_64/Linux2.4.xxVERSION                     ......
  • 【IEEE独立出版】2024年第四届电子信息工程与计算机科学国际会议(EIECS 2024)
    【IEEE独立出版|往届快至会后2个月检索,刊后1个月检索】2024年第四届电子信息工程与计算机科学国际会议(EIECS 2024)20244th InternationalConferenceonElectronicInformationEngineeringandComputerScience中国延吉 |2024年9月27-29日| www.eiecs.org最终......
  • 机器学习之——决策树信息增益计算[附加计算程序]
    0前言本文主要介绍信息增益的计算公式并举出若干例子帮助理解。读者需要具备的知识有:信息熵、条件熵。本文所示用的数据集为:游玩数据集1.1节1信息增益计算公式g(D,A)表示在条件A下对于目标变量D的信息增益。H(D)表示随机变量D的信息熵。H(D|A)表示在随机变量A条件下......
  • 信息学奥赛初赛天天练-82-NOIP2014普及组-完善程序-机器语言、汇编语言、高级语言、计
    1NOIP2014普及组基础题11以下哪个是面向对象的高级语言()A汇编语言BC++CFortranDBasic2TB代表的字节数是()A2的10次方B2的20次方C2的30次方D2的40次方3二进制数00100100和00010101的和是()A00101000B001010......
  • springboot多媒体内容管理系统-计算机毕业设计源码08580
    摘 要随着人类向信息社会的不断迈进,风起云涌的信息时代正掀起一次新的革命,同时计算机网络技术高速发展,网络管理运用也变得越来越广泛。因此,建立一个多媒体内容管理系统(CMS)的设计与优化来管理多媒体内容信息,会使管理工作系统化、规范化,提高管理效率。本课题的研究对象是多媒......
  • springboot中小型酒店管理系统-计算机毕业设计源码02793
    摘要随着互联网和移动技术的快速发展,酒店行业也面临着巨大的变革和机遇。传统的酒店管理方式存在着信息不透明、预订流程繁琐等问题,无法满足现代消费者对便捷、高效、个性化服务的需求。因此,开发中小型酒店管理系统具有重要的意义。本文旨在设计和实现一种功能完善、易用且可......
  • 基于python+flask框架的基于移动端的疫情环境下大学生心理服务平台(开题+程序+论文) 计
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着全球疫情的持续蔓延,大学生群体作为社会的重要组成部分,其心理健康问题日益凸显。疫情期间,校园封闭管理、线上学习模式的转变、社交活动......
  • 基于python+flask框架的企业内部通讯系统(开题+程序+论文) 计算机毕设
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着企业规模的日益扩大和业务的全球化发展,企业内部沟通的高效性与及时性成为了影响企业运营效率与团队协作的关键因素。传统的沟通方式如......
  • 基于python+flask框架的心理健康管理系统(开题+程序+论文) 计算机毕设
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着现代社会节奏的加快与竞争的日益激烈,心理健康问题已成为不容忽视的社会议题。据统计,全球范围内心理健康问题的患病率逐年上升,对个人生......
  • 基于python+flask框架的基于web的线上考试管理系统的设计与实现(开题+程序+论文) 计算机
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展,教育领域正经历着深刻的变革。传统考试模式因其效率低下、管理繁琐且难以适应大规模、远程教学的需求,已逐渐显现出......