1. 背景与目标
在许多应用场景中,我们需要对某个复杂概率分布 p ( x ) p(x) p(x) 进行以下操作:
- 随机抽样:从 p ( x ) p(x) p(x) 所描述的分布中生成样本。
- 计算数学期望:对于一个定义在
x
x
x 上的函数
f
(
x
)
f(x)
f(x),求它的数学期望:
E p [ f ( x ) ] = ∫ f ( x ) p ( x ) d x E_{p}[f(x)] = \int f(x)p(x)dx Ep[f(x)]=∫f(x)p(x)dx
传统方法的局限性
- 当 p ( x ) p(x) p(x) 的形式非常复杂(例如高维、多模态分布)时,传统方法(如直接采样或积分)难以实现。
- 马尔可夫链蒙特卡罗法 (MCMC) 提供了一种有效解决这些问题的思路。
2. MCMC 的核心思想
核心思想是:
- 构造一个马尔可夫链 { X t } t = 0 ∞ \{X_t\}_{t=0}^\infty {Xt}t=0∞,它的状态空间覆盖目标分布 p ( x ) p(x) p(x) 的定义域。
- 通过让马尔可夫链在 t → ∞ t \to \infty t→∞ 时达到平稳分布,使得 p ( x ) p(x) p(x) 恰好是马尔可夫链的平稳分布。
- 从这个马尔可夫链中抽取的样本可以用来近似目标分布。
马尔可夫链的性质:
假设马尔可夫链 X = { X 0 , X 1 , … , X t , … } X = \{X_0, X_1, \dots, X_t, \dots\} X={X0,X1,…,Xt,…}:
- 马尔可夫链的状态空间为 S S S;
- 转移概率矩阵 P P P 的平稳分布为 π ( x ) = p ( x ) \pi(x) = p(x) π(x)=p(x)。
根据遍历定理:
- 当 t → ∞ t \to \infty t→∞ 时,马尔可夫链的样本分布会收敛到目标分布 p ( x ) p(x) p(x)。
- 马尔可夫链中的样本序列可以用于计算目标分布 p ( x ) p(x) p(x) 下的数学期望。
3. 计算数学期望
假设马尔可夫链产生的样本序列为 { x m + 1 , x m + 2 , … , x n } \{x_{m+1}, x_{m+2}, \dots, x_n\} {xm+1,xm+2,…,xn},其中前 m m m 个样本是“燃烧期”(burn-in period)的样本,为了让链达到平稳分布,通常会舍弃这些样本。
对于函数 f ( x ) f(x) f(x),其数学期望的估计公式为:
E ^ f = 1 n − m ∑ i = m + 1 n f ( x i ) (19.32) \hat{E}f = \frac{1}{n-m} \sum_{i=m+1}^n f(x_i) \tag{19.32} E^f=n−m1i=m+1∑nf(xi)(19.32)
- n n n:总的样本数量;
- m m m:燃烧期的步数;
- f ( x i ) f(x_i) f(xi):函数 f f f 在第 i i i 个样本处的取值。
解释:
- 样本的平均值 E ^ f \hat{E}f E^f 是对 f ( x ) f(x) f(x) 在目标分布 p ( x ) p(x) p(x) 下数学期望 E p [ f ( x ) ] E_p[f(x)] Ep[f(x)] 的估计。
- 燃烧期 m m m 是为了确保马尔可夫链已经达到平稳分布,不受初始状态的影响。
4. 构造有效的马尔可夫链
MCMC 方法的核心是如何构造满足平稳分布为 p ( x ) p(x) p(x) 的马尔可夫链。
转移矩阵的定义
- 转移矩阵 P P P 决定了马尔可夫链的状态转移规则。
- 为了保证马尔可夫链能够以 p ( x ) p(x) p(x) 作为平稳分布,转移矩阵 P P P 必须满足遍历性和细致平衡条件。
常用构造方法
-
Metropolis-Hastings 算法:
- 利用接受-拒绝采样的思想,通过构造一个特定的接受概率,确保平稳分布为目标分布。
- 是 MCMC 的经典算法。
-
Gibbs 采样:
- 一种特殊的 MCMC 方法,通过对每一维进行条件采样来更新样本。
5. 收敛性和样本独立性
(1) 收敛性
- MCMC 方法的收敛性通常是可以证明的。
- 当样本分布接近平稳分布时,马尔可夫链的后续样本就可以近似视为从目标分布 p ( x ) p(x) p(x) 中抽取。
(2) 样本独立性
- 由于马尔可夫链样本之间存在相关性(即相邻样本不是完全独立的),会影响估计的准确性。
- 为了减小相关性,可以对样本序列进行“稀疏化”,即每隔一定步长取一个样本。
6. MCMC 方法的优缺点
优点
- 能够高效处理复杂的多维概率分布,即使直接采样困难也能使用。
- 灵活性强,可以根据具体问题构造不同的马尔可夫链。
缺点
- 需要选择合理的燃烧期 m m m 和采样步长,参数调整可能较复杂。
- 样本之间有相关性,可能需要更多样本以保证估计精度。
7. 总结
马尔可夫链蒙特卡罗法 (MCMC) 是一种通过构造马尔可夫链模拟复杂分布的方法,其基本思想是:
- 构造一个马尔可夫链,其平稳分布为目标分布 p ( x ) p(x) p(x);
- 通过迭代产生的样本来估计数学期望。
核心公式:
E
^
f
=
1
n
−
m
∑
i
=
m
+
1
n
f
(
x
i
)
\hat{E}f = \frac{1}{n-m} \sum_{i=m+1}^n f(x_i)
E^f=n−m1i=m+1∑nf(xi)
常见的 MCMC 算法包括 Metropolis-Hastings 和 Gibbs 采样,适用于高维、多模态的复杂分布抽样和估计问题。
标签:采样,MCMC,平稳,样本,马尔可夫,分布,蒙特卡罗 From: https://blog.csdn.net/u013172930/article/details/144591888