马尔科夫链是一种用于描述系统从一个状态转移到另一个状态的随机过程。它得名于俄罗斯数学家安德雷·马尔科夫,他在20世纪初提出了这种数学模型。马尔科夫链的一个关键特性是无记忆性,即未来状态的概率只依赖于当前状态,而不依赖于过去的状态。这种性质使得马尔科夫链在许多领域中具有广泛的应用,如统计学、物理学、生物学、经济学、计算机科学等。马尔科夫链的概念由安德雷·马尔科夫在1906年提出,最初用于处理文学作品中的字符序列的统计特性。马尔科夫希望通过研究无记忆性的随机过程,挑战传统的独立事件统计学理论。马尔科夫链的理论基础在20世纪得到了显著的发展,特别是在第二次世界大战期间和战后时期。随着计算技术的进步,马尔科夫链的计算方法得到了极大的提升,进一步推动了其应用范围的扩展。20世纪下半叶,马尔科夫链在经济学、金融学和统计学中的应用逐渐成熟。尤其是随着贝叶斯统计和机器学习的兴起,隐马尔科夫模型(HMM)和马尔科夫链蒙特卡罗方法(MCMC)成为了数据分析和建模的重要工具。在现代,马尔科夫链的应用已渗透到各个科学和工程领域,并继续通过新的算法和计算能力的提升,不断扩展其应用范围。例如,强化学习中的马尔科夫决策过程(MDP)是人工智能研究中的一个重要方向,用于设计和分析智能代理在动态环境中的决策策略。
一、马尔科夫链概述
在机器学习算法中,马尔可夫链(Markov chain)是个很重要的概念。马尔可夫链(Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain),为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。马尔科夫链是指数学中具有马尔科夫性质的离散事件随机过程。在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。
1.1 马尔科夫链的引入
搜索引擎采用不同的算法将网页按给定的关键字以相关度递减的方式排序.其中一种算法的思想是计算马尔可夫链的稳态分布。互联网由一系列相互链接的网页组成。这些网页和它们之间的链接关系构成了一张图。如图1所示,图中的节点是所有的网页\(\mathcal{X}\) 。若网页\(i\)有一个到网页\(j\)的链接,则图中有一条由\(i\)到\(j\)的弧(有向边)。
图1 | 图2 |
---|---|
在图1中 \(P(A, B) = 1/2 ,P(D, E) = 1/3\),可由这些网页节点A、B、C、D和E的出度来导出。直观上看,一个高级别网页所指向的网页也应具有较高的级别。因此,我们定义网页 \(i\) 的级别 $ \pi(i)$ 为一个正数,并且满足以下公式:
\[\pi(i) = \sum_{j \in \mathcal{X}} \pi(j) P(j, i), \quad i \in \mathcal{X} \]\(P(j, i)\) 表示所有网页\(j\)的外向链接中指向\(i\)的链接所占的比例。如果\(j\)没有指向\(i\)的链接,则$P(j, i) = 0 $。可以将这些等式以矩阵的形式记作:
\[\pi = \pi P \tag{1} \]这里,$\pi $ 是一个以$\pi(i) $为分量的行向量,而 \(P\) 是一个以$P(i, j) $为元素的方阵。
式(1)称为平衡方程。这里我们注意到,如果一个向量\(\pi\)是这个方程的解,那么\(\pi\) 的任意倍数也是这个方程的解。为方便起见,我们将解归一化,使得所有网页的级别之和为1:
\[\sum_{i \in \mathcal{X}} \pi(i) = 1 \]对于图1的例子,平衡方程为:
\[\begin{aligned} &\pi(A) = \pi(C) + \pi(D) \times (1/3) \\ &\pi(B) = \pi(A) \times (1/2) + \pi(D) \times (1/3) + \pi(E) \times (1/2) \\ &\pi(C) = \pi(B) + \pi(E) \times (1/2) \\ &\pi(D) = \pi(A) \times (1/2) \\ &\pi(E) = \pi(D) \times (1/3). \end{aligned} \]再加上\(\pi(i)\)的和为1这一条件,可以得到:
\[\pi = [\pi(A), \pi(B), \pi(C), \pi(D), \pi(E)] = \frac{1}{39} [12, 9, 10, 6, 2] \]由此可以看到,网页\(A\) 具有最高的级别,网页\(E\)具有最低的级别。运用这一方法的搜索引擎会将这些网页级别与其他因素相结合来进行网页排序。一些搜索引擎也会采用这一度量的变种来对网页进行排序,这就是谷歌公司创始人之一拉里·佩奇提出的PageRank排序原理。
1.2 马尔科夫链的理论
概率向量: 若向量 \(\boldsymbol{u}=\left(u_1 u_2 \cdots u_n\right)^{\mathrm{T}}\) 满足 \(u_i \geqslant 0(i=1,2, \cdots, n)\) 且 \(\sum_{i=1}^n u_i=1\), 则称 \(\boldsymbol{u}\) 为概率向量。若矩阵 \(\left[a_{i j}\right]_{n \times n}\) 各个行向量均为概率向量, 称矩阵 \(\left[a_{i j}\right]_{n \times n}\) 为随机(概率)矩阵。
三阶方阵 \(\boldsymbol{P}=\left[\begin{array}{ccc}0.8 & 0.15 & 0.05 \\ 0.2 & 0.5 & 0.3 \\ 0.1 & 0.2 & 0.7\end{array}\right]\) 就是概率矩阵。
马尔科夫链: 设 \(X_1, X_2, \cdots, X_n, \cdots\) 为离散的随机变量序列, 简记为 \(\left\{X_n\right\}, X_n\) 的所有可能取值的全体称为 \(\left\{X_n\right\}\) 的状态空间, 记为 \(E=\left\{x_1, x_2, x_3, \cdots\right\}\) 。若对任意的正整数 \(n\) 及任意的 \(x_{i_1}, x_{i_1}, x_{i_1}, \cdots, x_{i_n}, x_{i_{n+1}} \in E\), 只要
就有
\[P\left(X_{n+1}=x_{i_{e+1}} \mid X_1=x_{i_i}, X_2=x_{i_2}, X_3=x_{i_1}, \cdots, X_n=x_{i_n}\right)=P\left(X_{n+1}=x_{i_{n+1}} \mid X_n=x_{i_e}\right) \]则称 \(\left\{X_n\right\}\) 为马尔科夫链, 简称马氏链。
齐次马氏链: \(\left\{X_n\right\}\) 为马氏链, 若对任意的 \(x_i, x_j \in E\), 总有
则称 \(\left\{X_n\right\}\) 为齐次马氏链。
转移矩阵:若 \(\left\{X_n\right\}\) 为齐次马氏链, 称 \(P\left(X_{n+k}=x_j \mid X_n=x_i\right)\) 为 \(\left\{X_n\right\}\) 从状态 \(x_i\) 到状态 \(x_j\) 的 \(k\) 步转移概率, 记作 \(p_{i j}(k)\); 称以 \(p_{i j}(k)\left(x_i, x_j \in E\right)\) 为元素的矩阵为 \(\left\{X_n\right\}\) 的 \(k\) 步转移矩阵, 记作 \(\boldsymbol{P}(k)\), 特别地, 将一步转移概率和一步转移矩阵分别记为 \(p_{i j}\) 和 \(\boldsymbol{P}\) 。显然, 一步和多步转移矩阵都是随机矩阵。
**极限矩阵: **若矩阵 \(\boldsymbol{A}(n)=\left[\begin{array}{cccc}a_{11}(n) & a_{12}(n) & \cdots & a_{1 m}(n) \\ a_{21}(n) & a_{22}(n) & \cdots & a_{2 m}(n) \\ \cdots & \cdots & \cdots & \cdots \\ a_{m 1}(n) & a_{m 2}(n) & \cdots & a_{m m}(n)\end{array}\right]\) 每一个元素 \(a_{i j}(n)\) \((n=1,2,3, \cdots)\) 都是数列 \(\left\{a_{i j}(n)\right\}\) 的项, 称矩阵 \(\boldsymbol{A}(n)\) 为数列矩阵; 若对任意的 \(i, j=1,2, \cdots, m\) 都有 \(\lim _{n \rightarrow \infty} a_{i j}(n)=a_{i j}\) 成立, 即每个数列的极限都存在, 称矩阵 \(\boldsymbol{A}(n)\) 在 \(n \rightarrow \infty\) 时的极限为 \(\boldsymbol{A}=\left[a_{i j}\right]\), \(\boldsymbol{A}\) 是 \(\boldsymbol{A}(n)\) 的极限矩阵。
齐次马氏链的 \(k\) 步转移矩阵 \(\boldsymbol{P}(k)=\boldsymbol{P}^k\) 。
若齐次马氏链的 \(k\) 步转移矩阵 \(\boldsymbol{P}(k)\) 在 \(k \rightarrow \infty\) 的极限矩阵存在, 记为 \(\lim \boldsymbol{P}\), 则 \(\lim \boldsymbol{P}\) 是一个随机矩阵。该随机矩阵也是一个转移矩阵, 且对任意的自然数 \(n\), 都有 \((\lim \boldsymbol{P})^n=\lim \boldsymbol{P}\) 。
若齐次马氏链的 \(k\) 步转移矩阵 \(\boldsymbol{P}(k)\) 的极限矩阵存在, 则随着系统的不断演化, 最终系统状态之间的转移概率保持不变, 系统体现出统计规律性的特征, 就演化为一个稳定的系统。为了研究问题方便起见, 在实际问题中经常考虑有限介状态的齐次马氏链, 它们的 \(k\) 步转移矩阵的极限矩阵总存在。
二、马尔科夫链实例
2.1 案例1
马尔科夫链可以表示股市模型。设股市共有三种状态:牛市(Bull market), 熊市(Bear market)和横盘(Stagnant market)。每一个状态都以一定的概率转化到下一个状态。比如,牛市以0.025的概率转化到横盘的状态。这个状态概率转化图可以以矩阵的形式表示。如果我们定义矩阵\(P\)某一位置\(P(i,j)\)的值为\(P(j|i)\),即从状态i变为状态j的概率。另外定义牛市、熊市、横盘的状态分别为0、1、2,这样我们得到了马尔科夫链模型的状态转移矩阵。
图3 | 图4 |
---|---|
import numpy as np
import matplotlib.pyplot as plt
# 状态转移矩阵
transfer_matrix = np.array([[0.9, 0.075, 0.025],
[0.15, 0.8, 0.05],
[0.25, 0.25, 0.5]])
# 状态名和对应的索引位置
states = ["Bull", "Bear", "Stagnant"]
positions = np.array([1, 2, 3]) # 状态的图形位置
# 计算特征向量
eigenvalues, eigenvectors = np.linalg.eig(transfer_matrix)
max_eigval_index = np.argmax(np.abs(eigenvalues))
steady_state_vector = eigenvectors[:, max_eigval_index].real
# 归一化得到极限分布
steady_state_distribution = steady_state_vector / steady_state_vector.sum()
# 打印状态的极限分布,保留两位小数
print("状态的极限分布(保留两位小数):")
for state, value in zip(states, np.around(steady_state_distribution, 2)):
print(f"{state}: {value:.2f}")
2.2 案例2
保险公式将人的生存状态定义为三种:健康、疾病和死亡(第三中状态),用Xn=3表示.今年健康,明年可能突发疾病或偶然事件而死亡;今年疾病,明年可能继续疾病、健康或死亡,而一旦死亡,则不能再转为健康或疾病。根据统计,三种状态相互转化的概率如图5所示。
图5 | 图6 |
---|---|
2.3 案例3
图7 | 图8 |
---|---|
三、Python实现
#上面转移矩阵的极限分布计算
import numpy as np
# 定义转移概率矩阵
P = np.array([[0.2, 0.3, 0.5],
[0.1, 0.6, 0.3],
[0.4, 0.5, 0.1]])
# 计算多步转移矩阵
steps = [1, 2, 5, 10, 50, 100]
for step in steps:
P_n = np.linalg.matrix_power(P, step)
print(f"P^{step}:\n{np.round(P_n, 2)}\n")
# 计算极限矩阵
eigvals, eigvecs = np.linalg.eig(P.T)
eigvec1 = eigvecs[:, np.isclose(eigvals, 1)]
# 将特征向量归一化以使其总和为1
stationary = eigvec1 / eigvec1.sum()
stationary = stationary.real.flatten()
stationary = np.round(stationary, 2)
print("Stationary distribution:\n", stationary)
P^2:
[[0.27 0.49 0.24]
[0.2 0.54 0.26]
[0.17 0.47 0.36]]
P^10:
[[0.21 0.51 0.28]
[0.21 0.51 0.28]
[0.21 0.51 0.28]]
P^50:
[[0.21 0.51 0.28]
[0.21 0.51 0.28]
[0.21 0.51 0.28]]
Stationary distribution:
[0.21 0.51 0.28]
总结
马尔科夫链作为一种描述随机过程的数学工具,在多个领域中具有广泛的应用。其核心概念是无记忆性,使得它可以简洁而有效地建模复杂系统的动态行为。通过转移矩阵和极限矩阵,马尔科夫链能够描述系统在长期运行中的稳定状态。随着计算技术的进步,马尔科夫链的计算和模拟方法得到了极大的提升,进一步推动了其在经济学、生物信息学、通信、计算机科学以及物理化学等领域的应用和发展。马尔科夫链不仅在理论研究中具有重要地位,而且在实际问题解决中也展现出强大的实用性和灵活性。未来,随着数据规模的不断增长和计算能力的提升,马尔科夫链的应用将会更加广泛和深入,继续为科学研究和工程实践提供强有力的支持。