首页 > 其他分享 >一些AI数学基础

一些AI数学基础

时间:2024-11-02 20:20:58浏览次数:4  
标签:状态 概率 概率密度函数 变量 AI 基础 连续型 数学 我们

众所周知,在当前机器学习看待数据的很重要一个方式是概率,例如分类问题是建模一个P(Y=C|X)。
在面对离散变量的时候,例如人名这种离散变量。

假设有问题:给一个名字,判断该人是中国哪里人。(或许在现实生活中,该问题是不合理的,一般情况下无法根据人名判断是哪里人)

假设我们有所有省份的人名。我们可以统计不同人名属于某个省份的概率。这个概率可以通过“频率”来计算。
在这里,输入变量“人名”是一个离散型变量。当统计完成后,我们就得到了一个不错的分类模型。

然而,当输入变量是连续型变量的时候,我们无法通过频率来估计概率。连续型变量的概率也没有意义。
例如,从【1,5】这个区间取中任意一个数的概率都是0。因为其样本空间为无穷多。
再用频率去计算就相当于:

$$ \frac{1}{\infty} $$

这个时候,我们就需要对连续性变量的概率进行描述。
于是就引入了概率密度函数这个概念。

举一个例子:
假设一个电子监控设备在每个小时的开始时会被短暂地打开一次,并且无论设备已经使用了多长时间,它都有0.905的概率能够正常工作。

如果我们让随机变量 \(X\) 表示监控设备首次失效的小时数,那么 \(p_X(k) = \prod_{i=1}^{k} ,P_i\) 是 \(k\) 个独立概率的乘积。

。 绘制成图片如下:

如图是K从1-21不同取值下的概率值。如果我们再加上一条曲线:

那么很容易得出,任意一段区间[a,b]内,这些柱状体的面积近似于曲线在该区间的积分

函数 \( f(x) \) 在区间 \([a, b]\) 上的积分表示为:\( \int_{a}^{b} f(x) \, dx \)。

该函数就相当于概率密度函数。通常,我们也将该概率密度函数称为连续变量X的分布。

对于一些常见的概率密度函数,我们也有一些名字例如“正态分布”等。

当我们在面对机器学习任务时候,如果要建模的变量对象是一个连续型变量,有时会假设其服从某些常见分布。例如HMM的语音识别中,隐状态序列S的样本空间为有限的。而状态S对应的观测序列,也就是声音的特征向量是连续型变量。

这时候,如果我们想计算隐状态为Si条件下,某个观测状态的概率。由于观测状态是连续型的特征向量,无法直接统计概率。因此,我们假设已知隐状态S的条件下,观测状态为X的概率服从正态分布。这样就把有限个隐状态对应无数个连续型变量的问题建模为了有限个状态对应有限个不同的正态分布的问题。

标签:状态,概率,概率密度函数,变量,AI,基础,连续型,数学,我们
From: https://www.cnblogs.com/jiyuebo/p/18522411

相关文章

  • 【网络安全入门】学习网络安全必须知道的100 个网络基础知识
    什么是链接?链接是指两个设备之间的连接。它包括用于一个设备能够与另一个设备通信的电缆类型和协议。2OSI参考模型的层次是什么?有7个OSI层:物理层,数据链路层,网络层,传输层,会话层,表示层和应用层。3什么是骨干网?骨干网络是集中的基础设施,旨在将不同的路由和数据......
  • 2024-2025-1 20241316《计算机基础与程序设计》第六周学习总结
    2024-2025-120241316《计算机基础与程序设计》第六周学习总结作业信息这个作业属于哪个课程2024-2025-1-计算机基础与程序设计这个作业要求在哪里2024-2025-1计算机基础与程序设计第六周作业这个作业的目标计算机科学概论第7章《C语言程序设计》第5章作业正......
  • 信息抽取与知识图谱在医疗行业的融合:AI技术的深度应用案例
    一、系统概述在现代医疗行业,信息的碎片化与数据孤岛问题日益严重,导致医疗服务和研究效率的降低。思通数科针对这一现状,推出了一款开源免费的信息抽取与知识图谱平台,旨在将医疗数据的深度分析与智能化服务结合起来。二、应用场景在一家大型医疗中心,信息技术部门面临着整合各科......
  • 极市平台 | ECCV‘24|Plain-Det:同时支持多数据集训练的新目标检测
    本文来源公众号“极市平台”,仅用于学术分享,侵权删,干货满满。原文链接:ECCV'24|Plain-Det:同时支持多数据集训练的新目标检测极市导读论文提出了Plain-Det,提供了灵活性以适应新的数据集,具有跨多样数据集的稳健性能、训练效率和与各种检测架构的兼容性。结合Def-DETR和Plain-Det,......
  • 2024-2025-1 20241425《计算机基础与程序设计》第6周学习总结
    2024-2025-120241425《计算机基础与程序设计》第6周学习总结作业信息这个作业属于哪个课程2024-2025-1-计算机基础与程序设计这个作业要求在哪里https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP/homework/13276这个作业的目标计算机科学概论(第七版)第7章......
  • 基础数论
    基础数论Update:2024/11/02。素数素数和合数定义若\(p\in\Zeta\),且\(p\not=0,\pm1\),其约数集合中的元素只有\(1\)和\(p\)本身,那么称\(p\)为素数。若\(a\in\Zeta\),且\(a\not=0,\pm1\),\(a\)不为素数,则为合数。素数一般指正的素数。素数计数\(\pi(x)......
  • javaScript 和 Java 的语法区别(有前端基础)
    目录一、语法风格1.变量声明2.代码块3.分号二、面向对象编程1. 类和对象的定义2. 方法和属性的访问修饰符3.继承方式 三、数据类型和类型转换1.数据类型 2.类型转换四、异常处理1.语法结构2.异常类型五、开发工具和生态系统1.开发工具2.运行环境各......
  • JavaScript。—关于语法基础的理解—
    一、程序控制语句JavaScript提供了if、if else 和 switch 3种条件语句,条件语句也可以嵌套。(一)、条件语句1、单向判断: if...(1)概述<if>元素用于在判断该语句是否满足特定条件。如果条件不成立,<if>元素内的语句不会被执行。(2)语法格式if(条件){......
  • Python基础学习(十一)面向对象编程(进阶)
    代码获取:https://github.com/qingxuly/hsp_python_course完结版:Python基础学习(完结版)面向对象编程(进阶)面向对象编程三大特征面向对象编程有三大特征:封装、继承、多态。面向对象编程—封装封装介绍封装(encapsulation)就是把抽象出的数据[属性]和对数据的操作[方法]......
  • Python基础学习(十)面向对象编程(基础)
    代码获取:https://github.com/qingxuly/hsp_python_course完结版:Python基础学习(完结版)面向对象编程(基础)类与对象类与实例的关系类与实例的关系示意图快速入门—面向对象的方式解决养猫问题#定义一个猫类,age,name,color是属性,或者称为成员变量#Cat类就是你......