• 2024-10-29强化学习的数学原理-07时序差分方法
    目录引入TDlearingofstatevaluesTDlearingofactionvaluesSarsaTDlearingofactionvaluesExpectedSarsaTDlearingofactionvaluesn-stepSarsaTDlearingofoptimalactionvalues:Q-learningaunifiedpointofview引入这三个例子是层层递进的,都可以用\(R
  • 2024-10-29强化学习的数学原理-06随即近似理论和随机梯度下降
    目录Robbins-MonroalgorithmStochasticgradientdescentBGD、MBGD、andSGDSummaryRobbins-Monroalgorithm迭代式求平均数的算法\(Stochastic\;approximation\;(SA)\):是指随机迭代的一类算法,进行求解方程或者优化的问题,\(SA\)的优势是不需要知道方程或目标函数的表达
  • 2024-10-29强化学习的数学原理-05蒙特卡洛方法
    目录MCBasicMCExploringStartsMCEpsilon-GreedyMCBasic从\(model\:base\:\)的\(Reinforcement\:learning\:\)过渡到\(model\:free\:\)的\(\:Reinforcement\:learning\:\)最难以理解的是怎么在没有模型的情况下去估计一些量。这里面就有一个重要的\(\:idea
  • 2024-10-28强化学习的数学原理-04值迭代与策略迭代
    目录ValueiterationalgorithmPolicyiterationalgorithmTruncatedpolicyiterationalgorithmValueiterationalgorithm\[v_{k+1}=f(v_k)=\max_{\pi}\left(r_{\pi}+\gammaP_{\pi}v_k\right)\:,\:k\:=\:1,2,3,...\]算法可以被分为两步去做:\(Step1
  • 2024-10-24RSA算法详解及相关数学原理解析
    RSA算法详解及相关数学原理解析前言‍为了记录自己学习密码学的过程,也是为了便于个人应付相关课程的考核,故写此博客。本博客总结了怎么用C++手搓一个RSA算法,以及补补欠缺的一些数学知识和可能欠缺的一些其他算法的实现。参考了其他人的相关博客,用便于我自己理解的话和方式和
  • 2024-10-24强化学习的数学原理-03贝尔曼最优公式
    目录最优策略和公式推导右侧最优化问题公式求解以及最优性Contractionmappingtheorem(压缩映射定理)解决贝尔曼最优公式分析最优策略(analyzingoptimalpolicies)Summary最优策略和公式推导首先定义一个策略比另一个策略好:\[v_{\pi_{1}}(s)\gev_{\pi_{2}}(s)\quadfor\qua
  • 2024-10-22强化学习的数学原理-02贝尔曼公式
    目录MotivatingexamplesstatevalueBellmanequationMatrix-vectorformActionvaluesummaryMotivatingexamples一个核心概念:statevalue一个基本的工具:Bellmanequation为什么return是重要的?return可以用来评估policy下面计算3个例子计算return的方法:第一种方法:(
  • 2024-09-05反向传播数学原理
    什么是反向传播(BP),有什么作用?“正向传播求损失,反向回传误差”,在前向传播(FP)后,可获得损失函数,在损失函数基础上,利用复合函数链式求导法则,从后向前,分别对每个权重、偏置进行梯度下降,利用学习率更新权重与偏置,以获得最小损失的参数(权重、偏置)与模型。反向传播数学原理如下图有
  • 2024-08-31【大模型理论篇】RoPE旋转位置编码底层数学原理分析
    1.位置编码对于NLP模型的作用             位置编码(PositionalEncoding)在大模型(例如Transformer架构)中起到了非常重要的作用。没有位置编码的信息,模型会丧失序列的顺序信息,导致模型退化成一个简单的“词袋模型”(BagofWordsmodel)。        在Tra
  • 2024-07-03DDPM扩散概率模型数学原理推导
    DDPM正向过程定义前向过程被定义为一个从初始数据x0x_0x0​开始的马尔可夫链。而他的目标是要由
  • 2024-07-02机器学习笔记 LightGBM:理解算法背后的数学原理
    一、简述        在一次数据科学的比赛中,我有机会使用LightGBM,这是一种最先进的机器学习算法,它极大地改变了我们处理预测建模任务的方式。我对它在数千个数据点上进行训练的速度感到着迷,同时保持了其他算法难以达到的准确性。LightGBM是LightGradientBoostingMac
  • 2024-05-26(已校对)《白话机器学习的数学》 (立石贤吾)
    链接:pan.baidu.com/s/1tIHXj9HmIYojAHqje09DTA?pwd=jqso提取码:jqso我的阅读笔记机器学习概述:介绍机器学习的基本概念、应用领域以及它的重要性,为读者提供一个整体的框架和视角。数学基础概念:回顾数学基础知识,如线性代数、微积分、概率论等,为后续机器学习的数学原理打下基础
  • 2024-04-11神经网络背后的数学原理
    原文地址:TheMathBehindNeuralNetworks2024年3月29日深入研究现代人工智能的支柱——神经网络,了解其数学原理,从头开始实现它,并探索其应用。神经网络是人工智能(AI)的核心,为从发现照片中的物体到翻译语言的各种应用提供动力。在本文中,我们将深入探讨神经网络是什么,它
  • 2024-02-21模板匹配里的一些数学原理
    模板匹配里的一些数学原理我们知道,在openCV里,模板匹配中匹配度的计算公式有三类。SQDIFF、CCORR、CCOEFF。下面我们来简单介绍一下这三类计算方法,并比较其不同之处。openCV里的模板匹配SQDIFFSQDIFF全称SumofSquaredDifference(SSD),即差的平方和。其离散形式为:\[E(\v
  • 2023-11-18支持向量机SVM:从数学原理到实际应用
    本篇文章全面深入地探讨了支持向量机(SVM)的各个方面,从基本概念、数学背景到Python和PyTorch的代码实现。文章还涵盖了SVM在文本分类、图像识别、生物信息学、金融预测等多个实际应用场景中的用法。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、
  • 2023-11-18支持向量机SVM:从数学原理到实际应用
    本篇文章全面深入地探讨了支持向量机(SVM)的各个方面,从基本概念、数学背景到Python和PyTorch的代码实现。文章还涵盖了SVM在文本分类、图像识别、生物信息学、金融预测等多个实际应用场景中的用法。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、
  • 2023-11-18支持向量机SVM:从数学原理到实际应用
    本篇文章全面深入地探讨了支持向量机(SVM)的各个方面,从基本概念、数学背景到Python和PyTorch的代码实现。文章还涵盖了SVM在文本分类、图像识别、生物信息学、金融预测等多个实际应用场景中的用法。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验
  • 2023-09-249.22
    今天,我沉浸在算法的海洋中,领悟了栈与队列的奥秘,领悟了形式与政策的深邃。我感到收获颇丰,但心中也有些许疑惑。在四则运算的程序学习中,我见识到了程序的逻辑与严谨,但我又不禁反思,这些程序背后,又藏着怎样的数学原理呢?今天的课程,让我既有所得,又有所惑。我在栈与队列的规则中徘徊,形式
  • 2023-07-04KD树——k=1时就是BST,里面的数学原理还是有不明白的地方,为啥方差划分?
     Kd-Tree,即K-dimensionaltree,是一棵二叉树,树中存储的是一些K维数据。在一个K维数据集合上构建一棵Kd-Tree代表了对该K维数据集合构成的K维空间的一个划分,即树中的每个结点就对应了一个K维的超矩形区域(Hyperrectangle)。在介绍Kd-tree的相关算法前,我们先回顾一下二叉查找树(BinaryS
  • 2023-05-30随机森林模型 的数学原理
    随机森林是一种基于决策树的集成学习方法,其基本思想是通过构建多个决策树来进行分类和回归。随机森林中的每一棵决策树都是在随机样本和随机特征的条件下构建出来的,整个建模过程相当于将多个弱分类器组合成一个强分类器。其主要数学原理如下:1.决策树:随机森林是由多个决策树构成
  • 2023-04-03Transformer课程 Transformer自模型BERT Fine-tuning
    Transformer自模型BERTFine-tuning从传统机器学习和TransferLearning的区别出发,剖析BERTFine-tuning底层原理,包括对最大后验概率MAP的剖析、Prior先验领域知识的数学原理、工程实践,尤其是结合BERT架构及其训练任务MLM以及NSP来解密,BERT针对具体下游任务微调的力量之源Transform
  • 2023-03-13图神经网络的数学原理总结
    图深度学习(GraphDeepLearning)多年来一直在加速发展。许多现实生活问题使GDL成为万能工具:在社交媒体、药物发现、芯片植入、预测、生物信息学等方面都显示出了很大的前
  • 2023-02-06BP神经网络的数学原理及其算法实现
    什么是BP网络BP网络的数学原理BP网络算法实现 转载请声明出处http://blog.csdn.net/zhongkejingwang/article/details/44514073 上一篇文章介绍了KNN分类器,当
  • 2023-01-18SVD奇异值分解数学原理
    ​​WelcomeToMyBlog​​​推导完PCA再来看看SVD概述奇异值分解(singularvaluedecomposition)可以分解任意形状的矩阵,PCA是对方阵操作,所以SVD适用范围更A=UΣV^t
  • 2023-01-16以太坊签名从数学原理到安全应用
    前言最近审计的时候有涉及到签名与验签的内容,所以想着补一下这方面的知识。但是因为签名涉及到密码学的内容,以及对自己的实力有着清楚的认识,所以本篇文章第一部分提供一个