首页 > 其他分享 >机器学习数学基础之信息论

机器学习数学基础之信息论

时间:2023-04-06 19:47:46浏览次数:32  
标签:mathbb 机器 log 信息 KL 数学 mathbf 信息论 sim

信息论背后的原理是:从不太可能发生的事件中能学到更多的有用信息。

  • 发生可能性较大的事件包含较少的信息
  • 发生可能性较小的事件包含较多的信息
  • 独立事件包含额外的信息

对于事件 \(\mathbf x=x\),定义自信息self-information为:

\[I(x)=-\log P(x) \]

自信息仅仅处理单个输出。如果计算自信息的期望,它就是熵,记作\(H(P)\):

\[H(\mathbf x)=\mathbb E_{\mathbf x\sim P}[I(x)]=-\mathbb E_{\mathbf x\sim P}[\log P(x)] \]

\(KL\)散度:对于给定的随机变量\(\mathbf x\),它的两个概率分布函数 \(P(x)\) 和 \(Q(x)\) 的区别可以用\(KL\)散度来度量:

\[D_{KL}(P||Q)=\mathbb E_{\mathbf xsim P}\left[\log \frac{P(x)}{Q(x)}\right]=\mathbb E{\mathbf x\sim P}\left[\log P(x) -\log Q(x) \right] \]

  • \(KL\)散度非负。当它为0时,当且仅当 \(P\)和\(Q\)是同一个分布(对于离散型随机变量),或者两个分布几乎处处相等(对于连续型随机变量)
  • \(D_{KL}(P||Q) \neq D_{KL}(Q||P)\)

交叉熵\(cross-entropy\):\(H(P,Q)=H(P)+D_{KL}(P||Q)=-\mathbb E{\mathbf x\sim P}\log Q(x)\)

标签:mathbb,机器,log,信息,KL,数学,mathbf,信息论,sim
From: https://www.cnblogs.com/crazypigf/p/17293925.html

相关文章

  • gcd纯数学思维
    https://codeforces.com/contest/1766/problem/D题意找到连续的最长gcd(a+k,b+k)==1(a<b,k={0,1,2,...})思路:gcd(a+k,b+k)==gcd(a+k,b-a)a-b=1时特判可以推出gcd(a+k,b+k)==gcd(a+k,b-a),具体证明见https://codeforces.com/blog/entry/110066设两个的结......
  • 深度学习基础入门篇[二]:机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、
    A.深度学习基础入门篇[二]:机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解1.基础指标简介机器学习的评价指标有精度、精确率、召回率、P-R曲线、F1值、TPR、FPR、ROC、AUC等指标,还有在生物领域常用的敏感性、特异性等指标。在分类任务中,各指标的计算......
  • Chapter1 机器学习基础
    机器学习的一些预备知识何为机器学习?我的理解是:机器学习就是从海量的数据中找到这些数据背后所蕴含的规律/意义(提取有用的信息)并利用这些信息来解决实际问题的一门学科。机器学习可以做什么?人脸识别、垃圾邮件分类、产品推荐、手写数字识别等等关键术语根据上述的图片解......
  • 一步步制作下棋机器人之 coppeliasim进行Scara机械臂仿真与python控制
    稚晖君又发布了新的机器人,很是强大。在编写时看到了稚晖君的招聘信息,好想去试试啊!小时候都有一个科幻梦,如今的职业也算与梦想有些沾边了。但看到稚晖君这种闪着光芒的作品,还是很是羡慕。以前就想做一个机械臂,实现远程象棋对战等功能,看到稚晖君的作品,更加心动了。心动不如行动,下......
  • HJ82_将真分数分解为埃及分数_数学
    参考高赞答案思路:将真分数分子、分母分别x2。目的使循环:分母除分子余数为0存在。1importsys2a=[]3forlineinsys.stdin:4a.append(line.strip().split("/"))5foriina:6l=[]7a=int(i[0])*28b=int(i[1])*29whilea:10......
  • ROS机器人SLAM创建地图
    ROS机器人SLAM创建地图连接小车sshclbrobot@clbrobot激活树莓派roslaunchclbrobotbringup.launch开启雷达打开另一个终端输入:sshclbrobot@clbrobot注意:必须已经校正完成继续输入:#打开雷达roslaunchclbrobotlidar_slam.launchc出现“odomreceived!”就代......
  • ROS机器人摄像头寻线
    ROS机器人摄像头寻线连接小车注意:必须在同一区域网sshclbrobort@clbrobort激活树莓派主板roslaunchclbrobotbringup.launch开启摄像头开新终端输入:[email protected]打开寻线控制器roslaucnriki_line_followerriki_line.launch......
  • python机器学习案例系列教程——K最近邻算法(KNN)、kd树
    全栈工程师开发手册(作者:栾鹏)python数据挖掘系列教程K最近邻简介K最近邻属于一种估值或分类算法,他的解释很容易。我们假设一个人的优秀成为设定为1、2、3、4、5、6、7、8、9、10数值表示,其中10表示最优秀,1表示最不优秀。我们都知道近朱者赤,近墨者黑,我们想看一个人是什么样的,看......
  • python机器学习案例系列教程——文档分类器,朴素贝叶斯分类器,费舍尔分类器
    全栈工程师开发手册(作者:栾鹏)python数据挖掘系列教程github地址:https://github.com/626626cdllp/data-mining/tree/master/Bayes贝叶斯分类过程概述:首先有一批已知分类的数据集。对每个输入对象提取特征,根据输入对象的特征属性和输入对象的所属分类,计算分类与特征属性之间的概率......
  • 人工智能、机器学习、深度学习、数据挖掘、数据分析区分
    在开始学习python大数据之前,先要搞清楚人工智能、机器学习、深度学习、数据挖掘、数据分析都是什么意思。人工智能大家族包含着丰富的内容,分清楚了每一项都是做什么的,才能选对路线。人工智能AI人工智能分为强人工智能和弱人工智能。强人工智能是通过计算机来构造复杂的、拥有与人类......