首页 > 其他分享 >马尔可夫链蒙特卡罗方法 (MCMC) 的基本原理

马尔可夫链蒙特卡罗方法 (MCMC) 的基本原理

时间:2024-12-19 18:27:00浏览次数:5  
标签:采样 MCMC 平稳 样本 马尔可夫 分布 蒙特卡罗

1. 背景与目标

在许多应用场景中,我们需要对某个复杂概率分布 p ( x ) p(x) p(x) 进行以下操作:

  1. 随机抽样:从 p ( x ) p(x) p(x) 所描述的分布中生成样本。
  2. 计算数学期望:对于一个定义在 x x x 上的函数 f ( x ) f(x) f(x),求它的数学期望:
    E p [ f ( x ) ] = ∫ f ( x ) p ( x ) d x E_{p}[f(x)] = \int f(x)p(x)dx Ep​[f(x)]=∫f(x)p(x)dx

传统方法的局限性

  • 当 p ( x ) p(x) p(x) 的形式非常复杂(例如高维、多模态分布)时,传统方法(如直接采样或积分)难以实现。
  • 马尔可夫链蒙特卡罗法 (MCMC) 提供了一种有效解决这些问题的思路。

2. MCMC 的核心思想

核心思想是:

  • 构造一个马尔可夫链 { X t } t = 0 ∞ \{X_t\}_{t=0}^\infty {Xt​}t=0∞​,它的状态空间覆盖目标分布 p ( x ) p(x) p(x) 的定义域。
  • 通过让马尔可夫链在 t → ∞ t \to \infty t→∞ 时达到平稳分布,使得 p ( x ) p(x) p(x) 恰好是马尔可夫链的平稳分布。
  • 从这个马尔可夫链中抽取的样本可以用来近似目标分布。

马尔可夫链的性质:

假设马尔可夫链 X = { X 0 , X 1 , … , X t , …   } X = \{X_0, X_1, \dots, X_t, \dots\} X={X0​,X1​,…,Xt​,…}:

  1. 马尔可夫链的状态空间为 S S S;
  2. 转移概率矩阵 P P P 的平稳分布为 π ( x ) = p ( x ) \pi(x) = p(x) π(x)=p(x)。

根据遍历定理:

  • 当 t → ∞ t \to \infty t→∞ 时,马尔可夫链的样本分布会收敛到目标分布 p ( x ) p(x) p(x)。
  • 马尔可夫链中的样本序列可以用于计算目标分布 p ( x ) p(x) p(x) 下的数学期望。

3. 计算数学期望

假设马尔可夫链产生的样本序列为 { x m + 1 , x m + 2 , … , x n } \{x_{m+1}, x_{m+2}, \dots, x_n\} {xm+1​,xm+2​,…,xn​},其中前 m m m 个样本是“燃烧期”(burn-in period)的样本,为了让链达到平稳分布,通常会舍弃这些样本。

对于函数 f ( x ) f(x) f(x),其数学期望的估计公式为:

E ^ f = 1 n − m ∑ i = m + 1 n f ( x i ) (19.32) \hat{E}f = \frac{1}{n-m} \sum_{i=m+1}^n f(x_i) \tag{19.32} E^f=n−m1​i=m+1∑n​f(xi​)(19.32)

  • n n n:总的样本数量;
  • m m m:燃烧期的步数;
  • f ( x i ) f(x_i) f(xi​):函数 f f f 在第 i i i 个样本处的取值。

解释:

  • 样本的平均值 E ^ f \hat{E}f E^f 是对 f ( x ) f(x) f(x) 在目标分布 p ( x ) p(x) p(x) 下数学期望 E p [ f ( x ) ] E_p[f(x)] Ep​[f(x)] 的估计。
  • 燃烧期 m m m 是为了确保马尔可夫链已经达到平稳分布,不受初始状态的影响。

4. 构造有效的马尔可夫链

MCMC 方法的核心是如何构造满足平稳分布为 p ( x ) p(x) p(x) 的马尔可夫链。

转移矩阵的定义

  • 转移矩阵 P P P 决定了马尔可夫链的状态转移规则。
  • 为了保证马尔可夫链能够以 p ( x ) p(x) p(x) 作为平稳分布,转移矩阵 P P P 必须满足遍历性细致平衡条件

常用构造方法

  1. Metropolis-Hastings 算法

    • 利用接受-拒绝采样的思想,通过构造一个特定的接受概率,确保平稳分布为目标分布。
    • 是 MCMC 的经典算法。
  2. Gibbs 采样

    • 一种特殊的 MCMC 方法,通过对每一维进行条件采样来更新样本。

5. 收敛性和样本独立性

(1) 收敛性

  • MCMC 方法的收敛性通常是可以证明的。
  • 当样本分布接近平稳分布时,马尔可夫链的后续样本就可以近似视为从目标分布 p ( x ) p(x) p(x) 中抽取。

(2) 样本独立性

  • 由于马尔可夫链样本之间存在相关性(即相邻样本不是完全独立的),会影响估计的准确性。
  • 为了减小相关性,可以对样本序列进行“稀疏化”,即每隔一定步长取一个样本。

6. MCMC 方法的优缺点

优点

  • 能够高效处理复杂的多维概率分布,即使直接采样困难也能使用。
  • 灵活性强,可以根据具体问题构造不同的马尔可夫链。

缺点

  • 需要选择合理的燃烧期 m m m 和采样步长,参数调整可能较复杂。
  • 样本之间有相关性,可能需要更多样本以保证估计精度。

7. 总结

马尔可夫链蒙特卡罗法 (MCMC) 是一种通过构造马尔可夫链模拟复杂分布的方法,其基本思想是:

  1. 构造一个马尔可夫链,其平稳分布为目标分布 p ( x ) p(x) p(x);
  2. 通过迭代产生的样本来估计数学期望。

核心公式:
E ^ f = 1 n − m ∑ i = m + 1 n f ( x i ) \hat{E}f = \frac{1}{n-m} \sum_{i=m+1}^n f(x_i) E^f=n−m1​i=m+1∑n​f(xi​)

常见的 MCMC 算法包括 Metropolis-Hastings 和 Gibbs 采样,适用于高维、多模态的复杂分布抽样和估计问题。

标签:采样,MCMC,平稳,样本,马尔可夫,分布,蒙特卡罗
From: https://blog.csdn.net/u013172930/article/details/144591888

相关文章

  • 基于HMM隐马尔可夫模型的金融数据预测算法matlab仿真
    1.程序功能描述基于HMM隐马尔可夫模型的金融数据预测算法.程序实现HMM模型的训练,使用训练后的模型进行预测。2.测试软件版本以及运行结果展示MATLAB2022A版本运行 3.核心程序%初始化预测值矩阵yuce和误差矩阵erryuce=zeros(size(data,1),lens);err=zero......
  • 什么是隐马尔可夫模型
    隐马尔可夫模型(HiddenMarkovModel,HMM)隐马尔可夫模型(HMM)是一个统计模型,用来描述一个由不可观测(隐含)状态组成的马尔可夫过程,并且这些隐状态是通过可观测的变量(观测数据)来间接推测的。模型基本结构HMM是一个典型的概率图模型,由以下几个主要元素组成:隐状态集合(Hidden......
  • Python蒙特卡罗MCMC:优化Metropolis-Hastings采样策略与Fisher矩阵计算参数推断应用—
    全文链接:https://tecdat.cn/?p=38397原文出处:拓端数据部落公众号本文介绍了其在过去几年中的最新开发成果,特别阐述了两种有助于提升Metropolis-Hastings采样性能的新要素:跳跃因子的自适应算法以及逆Fisher矩阵的计算,该逆Fisher矩阵可用作提议密度。通过多个示例展示,这些......
  • 基于双路神经网络的滚动轴承故障诊断融合了原始振动信号 和 二维信号时频图像 的多输
    基于双路神经网络的滚动轴承故障诊断融合了原始振动信号和二维信号时频图像的多输入(多通道)故障诊断方法单路和双路都可时频图像算法可选小波变换,短时傅里叶变换,马尔可夫变迁场,格拉姆角场,S变换,递归图,灰度图等基于双路神经网络的滚动轴承故障诊断融合了原始振动信号和......
  • 通过多元蒙特卡罗模拟来预测股票价格的日内波动性
    作者:老余捞鱼原创不易,转载请标明出处及原作者。写在前面的话:    日内价格波动对交易策略的重要性不言而喻,尤其是美跨式交易策略(TheAmericanstraddle)。由于无法预测所有影响股价的因素,本文采用多元蒙特卡罗模拟来测试不同的价格路径,以评估交易策略的成功概率......
  • 蒙特卡罗方法 - 不同的峰值之间的混合挑战篇
    序言蒙特卡罗方法,也称为统计模拟法或统计试验法,是一种以概率统计理论为基础的数值模拟方法。自202020世纪40......
  • 隐马尔可夫模型(Hidden Markov Model,HMM)—有监督学习方法、概率模型、生成模型
    定义隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测从而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态的序列,称为状态序列(StateSequence);每个状态生成一个观测,而由此产生的观测......
  • 长度为T的固定马尔可夫链的反向过程
    扩散模型是一种概率模型,旨在通过逐渐去噪正态分布变量来学习数据分布,这相当于学习长度为T的固定马尔可夫链的反向过程。那什么是长度为T的固定马尔可夫链的反向过程呢?基本概念马尔可夫链:马尔可夫链是一系列状态的序列,其中每个状态只依赖于前一个状态,而不依赖于更早的状态。......
  • 【机器学习】马尔可夫随机场的基本概念、和贝叶斯网络的联系与对比以及在python中的实
    引言马尔可夫随机场(MarkovRandomField,简称MRF)是一种用于描述变量之间依赖关系的概率模型,它在机器学习和图像处理等领域有着广泛的应用文章目录引言一、马尔科夫随机场1.1定义1.2特点1.3应用1.4学习算法1.5总结二、选择马尔可夫随机场的学习算法的标准2.1问......
  • 逆概率采样-接受拒绝采样-MCMC采样
    importnumpyasnpimportscipyfrommatplotlibimportpyplotaspltdefpdf(x):if0<=x<0.25:return8*xelif0.25<=x<1:return8/3-8/3*xelse:return0defcdf(x):ifx<0:......