• 2025-01-17智能关键技术三:智能优化器
    贝叶斯网络模型原理贝叶斯网络是一种概率图模型,拓扑结构通常为一个有向无环图。贝叶斯网络的优势在于能够利用条件独立假设对多变量数据进行建模,并且自适应变量之间的相关性,具体是指每个变量的概率分布只和与它直接连接的父亲节点有关。使用这种方法能够比基于简单的独立性假设的
  • 2025-01-16萌新の概率与期望
    不说闲话概率和期望一直是自己非常薄弱的板块,最早学的时候其实就没有完全听懂。导致打模拟赛,甚至是ABC的时候遇到概率期望相关的题基本上都是绕道走,有时候暴力都打不出来。重修一下概率论,接下来是做题笔记,后面也会整理成讲题。P1365WJMZBMR打osu!/Easy期望入门题。题目
  • 2025-01-16智能关键技术三:智能优化器
    贝叶斯网络模型原理贝叶斯网络是一种概率图模型,拓扑结构通常为一个有向无环图。贝叶斯网络的优势在于能够利用条件独立假设对多变量数据进行建模,并且自适应变量之间的相关性,具体是指每个变量的概率分布只和与它直接连接的父亲节点有关。使用这种方法能够比基于简单的独立性假设的
  • 2025-01-13【AI中数学-概率论】 概率质量函数:离散世界的概率指南
    第四章概率论第5节概率质量函数:离散世界的概率指南概率质量函数(ProbabilityMassFunction,简称PMF)是离散型随机变量的重要工具,用于描述随机变量在各个可能取值上的概率分布。PMF不仅在概率论中占据核心地位,更在人工智能、机器学习和数据科学等领域发挥着关键作用。通过深入
  • 2025-01-11条件概率、贝叶斯定理、独立性、全概率公式的概念辨别与深入理解
    条件概率、贝叶斯定理、独立性、全概率公式的概念辨别与深入理解在概率论中,条件概率、贝叶斯定理、独立性和全概率公式是几个核心且紧密相关的概念。为了帮助学生深刻理解这些概念,我们将逐一进行辨析,并展示它们之间的区别与联系。一、条件概率条件概率是指在一个事件B已
  • 2025-01-07[PKUSC 2023 D1T3] 天气预测
    一棵以\(1\)为根的树,每个点\(u\)有一对权值\((a_u,b_u)\),\(a_u\)为\(1\)的概率为\(p_u\),为\(0\)的概率为\(1-p_u\)。确定\(a_u\)后,计算\(b_u\)为\(a_u\)与\(b_v\)(\(v\)为\(u\)的子节点)的众数(保证子节点个数为偶数个,即参与计算众数的点数为奇数)。求\(b_1\)
  • 2025-01-05一文讲明白朴素贝叶斯算法及其计算公式(入门普及)
    1、贝叶斯算法贝叶斯定理由英国数学家托马斯·贝叶斯(ThomasBayes)提出的,用来描述两个条件概率之间的关系。通常,事件A在事件B发生的条件下与事件B在事件A发生的条件下,它们两者的概率并不相同,但是它们两者之间存在一定的相关性,并具有以下公式,称之为贝叶斯公式:对于一
  • 2025-01-05万字长文:机器学习的数学基础(易读)
    ❝机器学习的特点是以计算机为工具和平台,以数据为研究对象,以学习方法为中心,是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。❞小编最近冲浪时发现了shunliz整理的各个数学领域的知识点列表,可惜的是只有名称,便结合gpt和网上资料
  • 2025-01-04几何分布
    几何分布是一种离散型概率分布,在概率论与数理统计中具有重要地位。以下为你详细介绍:1.定义与背景假设进行一系列独立重复试验,每次试验只有两个相互对立的结果(如成功或失败),且每次试验成功的概率均为\(p(0<p<1)\),失败的概率为\(1-p\)。几何分布用于描述在首次取得成功之前,所
  • 2025-01-03关于此题[ABC382E] Expansion Packs 概率DP的一些总结
    传送门首先看到这道题,我们发现想要求收集K个卡牌的期望开包数,必须要先求出每个包开出0~n张卡各自的概率,于是预示着这道题将要进行两次概率DP。首先我们求每个包开出0~n张卡各自的概率。这个很好求,我们假设f[i][j]表示前\(i\)张卡中开出\(j\)张卡的概率,那么显然有:\(f[i][j]=p[
  • 2024-12-26【深度学习基础|知识概述】基础数学和理论知识中的概率与统计知识:概率与概率分布、最大似然估计、损失函数的应用,附代码。
    【深度学习基础|知识概述】基础数学和理论知识中的概率与统计知识:概率与概率分布、最大似然估计、损失函数的应用,附代码。【深度学习基础|知识概述】基础数学和理论知识中的概率与统计知识:概率与概率分布、最大似然估计、损失函数的应用,附代码。文章目录【深度学习基
  • 2024-12-26开展深度学习项目所需要的数学基础|入门书籍·24-12-25
    小罗碎碎念深度学习作为一种复杂的机器学习方法,其核心在于构建和训练多层神经网络模型。为了深入理解和有效应用深度学习技术,掌握一定的数学基础是必不可少的。那么,**深度学习需要哪些数学基础呢?深度学习中的数学难点又在哪里?**这些问题常常困扰着初学者。在网络和书籍
  • 2024-12-25香港大学 CS 笔试真题(三)
    前言本文章主要内容为笔试当中的数学真题,涉及高等数学、线性代数、概率论与数理统计的基础知识以及其他数学理论。注:部分纯计算题目暂只给出题目,推荐参考网课为宋浩老师的B站课程。一、高等数学01连续性函数Amonkclimbsamountain.Hestartsat8amandreachesth
  • 2024-12-24一般大模型的熵是用什么来计算的,你认为这种生成式AI是能达到通用人工智能的吗?如果不是,你觉得达到通用人工智能最可能的路径是什么
    GPT-4oPoe1.大模型的熵是如何计算的?在生成式大模型(如GPT系列、Transformer模型)中,熵的计算通常用于衡量模型在预测过程中的不确定性,主要体现在概率分布上。以下是大模型中熵的具体计算方式:1.1概率分布与熵生成式大模型的输出通常是一个基于软最大化(softmax)的概率分布
  • 2024-12-23期望问题+ybt题解
    算法理解对于随机变量\(X\),有\(n\)个可能的取值,取值为\(x_i\)有\(P(x_i)\)的概率,则它的数学期望则为\(E(X)=\sum_{i=1}^nx_iP(x_i)\)性质其中期望的线性限制最重要,它可以将两个完全独立的期望拆分开来单独计算,详见例题T1:首先我们观察有\(n\)道题,我们根据期望的线
  • 2024-12-21大模型--采样技术 TopK TopP 惩罚系数--37
    目录1.参考2.概述重复惩罚(RepetitionPenalty)1.参考https://mp.weixin.qq.com/s/mBZA6PaMotJw7WeVdA359g2.概述大型语言模型(LLMs)通过“根据上下文预测下一个token的概率分布”来生成文本。最简单的采样方法是贪心采样(GreedySampling),它在每一步选择概率最高的token。
  • 2024-12-18R机器学习:朴素贝叶斯算法的理解与实操
    最近又看了很多贝叶斯算法的一些文章,好多的文章对这个算法解释起来会放一大堆公式,对代数不好的人来说真的很头疼。本文尝试着用大白话写写这个算法,再做个例子,帮助大家理解和运用。NaiveBayesisaprobabilisticmachinelearningalgorithmbasedontheBayesTheorem,used
  • 2024-12-18大模型你的知道它
    语言建模(LanguageModel,LM)语言建模是提高机器语言智能的主要方法之一。一般来说,LM旨在对词序列的生成概率进行建模,以预测未来失)tokens的概率。统计语言模型-->神经语言模型-->预训练语言模型-->大模型      统计语言模型(StatisticalLanguageModel,SLM)基于统计
  • 2024-12-14【机器学习】在不确定的光影中:机器学习与概率论的心灵共舞
    文章目录概率与统计基础:解锁机器学习的数据洞察之门前言一、概率论基础1.1概率的基本概念与性质1.1.1概率的定义1.1.2样本空间与事件1.1.3互斥事件与独立事件1.1.4概率的计算方法1.2条件概率与独立性1.2.1条件概率1.2.2独立事件1.3随机变量1.3.1随机变量的定
  • 2024-12-13概率题总结(gpt写的
    期望的性质线性性(Linearity)对任意两个随机变量\(X,Y\)和常数\(a,b\),无论\(X,Y\)是否独立,期望满足:\[\mathbb{E}[X+Y]=\mathbb{E}[X]+\mathbb{E}[Y],\quad\mathbb{E}[aX+b]=a\mathbb{E}[X]+b.\]单调性(Monotonicity)若随机变量\(X\)和\(Y\)几乎处
  • 2024-12-13如果有两种或以上的方法可以执行某项任务,其中之一可能会导致灾难,那么一定会有人选择那种可能导致灾难的方法。 Murphy's law
    https://baike.baidu.com/item/墨菲定律/746284 墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。其含义是说,无论是因为存在一个错误的方法,或是存在发生某种错误的潜在可能性,只要重复进行某项行动,错误在某个时刻就会发生。 [1-3]有关墨菲定律具体的起源
  • 2024-12-09Beta分布与汤普森采样:智能决策系统概率采样的理论基础
    在现代技术领域算法决策优化已成为核心竞争力。Meta通过广告位置优化提升点击率,Netflix利用缩略图优化提升用户参与度,亚马逊依靠产品推荐系统提升销售额——这些优化的背后都采用了基于Beta分布的汤普森采样算法。在各类决策系统中,探索与利用的平衡是一个根本性挑战。例如推荐系
  • 2024-12-05期望DP——解决从自身转移的情况
    期望DP——解决从自身转移的情况问题背景可以进行若干次抽奖,每一次分别获得\(0-k\)个物品的概率\(p_j\)都是确定的,给定一个\(X\),求抽到\(X\)个物品的期望抽奖次数。如果定义\(f_i\)为获得\(i\)个物品的期望次数,那么这个转移方程也是十分显然:\[f_i=1+\sum_{j=0}^kf
  • 2024-12-05Python实现几何分布图(Geometric Distribution)
    几何分布(GeometricDistribution)是一个离散概率分布,用于表示在一次独立重复试验中,直到首次成功所需的试验次数的分布。几何分布的特点1.每次试验的结果只有两种:成功或失败(比如掷硬币)。2.每次试验是独立的,且成功的概率p是恒定的。3.随机变量X表示第一次成功发生所需
  • 2024-12-02数学知识1
            人工智能的四要素是算法、算力、数据和场景,之所以能够智能,离不开长期发展的数学原理,人工智能背后强有力的支撑便是数学、物理等基础学科,本篇笔者浅谈、分享一下个人详学习人工智能的一个前期知识储备阶段对数学方面的积累,列举一些重要、常见的数学公式、算