机器学习数学基础之信息论

时间：2023-04-06 19:47:46浏览次数：42

标签：mathbb 机器 log 信息 KL 数学 mathbf 信息论 sim

信息论背后的原理是：从不太可能发生的事件中能学到更多的有用信息。

发生可能性较大的事件包含较少的信息
发生可能性较小的事件包含较多的信息
独立事件包含额外的信息

对于事件 \(\mathbf x=x\)，定义自信息self-information为：

\[I(x)=-\log P(x) \]

自信息仅仅处理单个输出。如果计算自信息的期望，它就是熵，记作\(H(P)\)：

\[H(\mathbf x)=\mathbb E_{\mathbf x\sim P}[I(x)]=-\mathbb E_{\mathbf x\sim P}[\log P(x)] \]

\(KL\)散度：对于给定的随机变量\(\mathbf x\),它的两个概率分布函数 \(P(x)\) 和 \(Q(x)\) 的区别可以用\(KL\)散度来度量：

\[D_{KL}(P||Q)=\mathbb E_{\mathbf xsim P}\left[\log \frac{P(x)}{Q(x)}\right]=\mathbb E{\mathbf x\sim P}\left[\log P(x) -\log Q(x) \right] \]

\(KL\)散度非负。当它为0时，当且仅当 \(P\)和\(Q\)是同一个分布（对于离散型随机变量），或者两个分布几乎处处相等（对于连续型随机变量）
\(D_{KL}(P||Q) \neq D_{KL}(Q||P)\)

交叉熵\(cross-entropy\)：\(H(P,Q)=H(P)+D_{KL}(P||Q)=-\mathbb E{\mathbf x\sim P}\log Q(x)\)

标签：mathbb,机器,log,信息,KL,数学,mathbf,信息论,sim
From： https://www.cnblogs.com/crazypigf/p/17293925.html

gcd纯数学思维
https://codeforces.com/contest/1766/problem/D题意找到连续的最长gcd(a+k，b+k)==1(a<b,k={0,1,2,...})思路：gcd(a+k,b+k)==gcd(a+k,b-a)a-b=1时特判可以推出gcd(a+k,b+k)==gcd(a+k,b-a),具体证明见https://codeforces.com/blog/entry/110066设两个的结......
深度学习基础入门篇[二]：机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、
A.深度学习基础入门篇[二]：机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解1.基础指标简介机器学习的评价指标有精度、精确率、召回率、P-R曲线、F1值、TPR、FPR、ROC、AUC等指标，还有在生物领域常用的敏感性、特异性等指标。在分类任务中，各指标的计算......
Chapter1 机器学习基础
机器学习的一些预备知识何为机器学习？我的理解是：机器学习就是从海量的数据中找到这些数据背后所蕴含的规律/意义（提取有用的信息）并利用这些信息来解决实际问题的一门学科。机器学习可以做什么？人脸识别、垃圾邮件分类、产品推荐、手写数字识别等等关键术语根据上述的图片解......
一步步制作下棋机器人之 coppeliasim进行Scara机械臂仿真与python控制
稚晖君又发布了新的机器人，很是强大。在编写时看到了稚晖君的招聘信息，好想去试试啊！小时候都有一个科幻梦，如今的职业也算与梦想有些沾边了。但看到稚晖君这种闪着光芒的作品，还是很是羡慕。以前就想做一个机械臂，实现远程象棋对战等功能，看到稚晖君的作品，更加心动了。心动不如行动，下......
HJ82_将真分数分解为埃及分数_数学
参考高赞答案思路：将真分数分子、分母分别x2。目的使循环：分母除分子余数为0存在。1importsys2a=[]3forlineinsys.stdin:4a.append(line.strip().split("/"))5foriina:6l=[]7a=int(i[0])*28b=int(i[1])*29whilea:10......
ROS机器人SLAM创建地图
ROS机器人SLAM创建地图连接小车sshclbrobot@clbrobot激活树莓派roslaunchclbrobotbringup.launch开启雷达打开另一个终端输入：sshclbrobot@clbrobot注意：必须已经校正完成继续输入：#打开雷达roslaunchclbrobotlidar_slam.launchc出现“odomreceived!”就代......
ROS机器人摄像头寻线
ROS机器人摄像头寻线连接小车注意：必须在同一区域网sshclbrobort@clbrobort激活树莓派主板roslaunchclbrobotbringup.launch开启摄像头开新终端输入：sshclbrobot@iproslaunchclbrobotcanera.launch打开寻线控制器roslaucnriki_line_followerriki_line.launch......
python机器学习案例系列教程——K最近邻算法(KNN)、kd树
全栈工程师开发手册（作者：栾鹏）python数据挖掘系列教程K最近邻简介K最近邻属于一种估值或分类算法，他的解释很容易。我们假设一个人的优秀成为设定为1、2、3、4、5、6、7、8、9、10数值表示，其中10表示最优秀，1表示最不优秀。我们都知道近朱者赤，近墨者黑，我们想看一个人是什么样的，看......
python机器学习案例系列教程——文档分类器，朴素贝叶斯分类器，费舍尔分类器
全栈工程师开发手册（作者：栾鹏）python数据挖掘系列教程github地址：https://github.com/626626cdllp/data-mining/tree/master/Bayes贝叶斯分类过程概述：首先有一批已知分类的数据集。对每个输入对象提取特征，根据输入对象的特征属性和输入对象的所属分类，计算分类与特征属性之间的概率......
人工智能、机器学习、深度学习、数据挖掘、数据分析区分
在开始学习python大数据之前，先要搞清楚人工智能、机器学习、深度学习、数据挖掘、数据分析都是什么意思。人工智能大家族包含着丰富的内容，分清楚了每一项都是做什么的，才能选对路线。人工智能AI人工智能分为强人工智能和弱人工智能。强人工智能是通过计算机来构造复杂的、拥有与人类......

机器学习数学基础之信息论

相关文章

赞助商

阅读排行