我们知道,并不是所有线性变换都可以对角化,因为它要求特征多项式能分解成一次因式的乘积,并且特征值的几何重数与代数重数相等。当特征多项式能分解成一次因式的乘积,而特征值的几何重数与代数重数不一定相等时,我们将看到该线性变换仍然在一个基下的矩阵具有简单的形式,且几何重数和代数重数在该形势下被赋予了新的内涵.
下面设 \(V\) 是域 \(\mathbb F\) 上的 \(n\) 维线性空间,\(\mathcal A\) 是其上的线性变换.
定义 1:设 \(W\) 是 \(V\) 的子空间,若 \(a\in W\) 蕴含 \(\mathcal A a\in W\),则称 \(W\) 是 \(\mathcal A-\) 不变子空间.
Remark 1:\(\ker\mathcal A\) 与 \(\rm{Im}\mathcal A\) 均为 \(\mathcal A-\)不变子空间.
Remark 2:\(V\) 与零子空间是平凡的 \(\mathcal A-\)不变子空间.
若 \(W\) 是 \(\mathcal A-\)不变子空间,则 \(\mathcal A\) 可以看成 \(W\) 上的线性变换. 具体地,我们定义 \(\mathcal A|W\) 是 \(W\) 上的线性变换,它在 \(W\) 的每一个向量 \(\alpha\) 上的像为 \(\mathcal A\alpha\),我们用简单的套话即可说明它是良定义的且保持运算.
我们由 \(V\) 的一个 \(\mathcal A-\) 不变子空间 \(W\) 导出商空间 \(V/W\) 上的线性变换 \(\widetilde{A}\),它在每一个 \(W\) 的陪集 \(\overline{\alpha}\) 上的像为 \(\overline{\mathcal A \alpha}\).
若 \(V\) 可以写成不变子空间的直和
\[V=W_1\oplus W_2\oplus\cdots\oplus W_s \]从 \(W_1,W_2,\cdots,W_s\) 各取一个基,它们合起来是 \(V\) 的一个基,\(\mathcal A\) 在这个基下的矩阵可以写成分块对角矩阵 \({\rm diag}\{A_1,A_2,\cdots,A_s\}\),其中 \(A_i\) 是 \(\mathcal A|W\) 在从 \(W_i\) 取出来的基下的矩阵.
我们接下来的思路是,将 \(V\) 写成非平凡的不变子空间的直和,每一个非平凡的不变子空间都存在一个基,使得 \(\mathcal A\) 限制在这个子空间后在这个基下的矩阵具有简单的形式.
定理 1:若 \(f(\lambda),g(\lambda)\in\mathbb F[\lambda]\),且 \(f(\lambda)\) 与 \(g(\lambda)\) 互素,则
\[\ker f(\mathcal A)g(\mathcal A)=\ker f(\mathcal A)\oplus\ker g(\mathcal A) \]证明:显然 \(\ker f(\mathcal A),\ker g(\mathcal A)\subset \ker f(\mathcal A)g(\mathcal A)\),因此 \(\ker f(\mathcal A)+\ker g(\mathcal A)\subset \ker f(\mathcal A)g(\mathcal A).\)
因为 \(f(\lambda)\) 与 \(g(\lambda)\) 互素,所以存在 \(u(\lambda),v(\lambda)\in\mathbb F[\lambda]\),使得 \(u(\lambda)f(\lambda)+v(\lambda)g(\lambda)=1\),将 \(\mathcal A\) 代入得
\[u(\mathcal A)f(\mathcal A)+v(\mathcal A)g(\mathcal A)=\mathcal I \]任取 \(\alpha\in \ker f(\mathcal A)g(\mathcal A)\),将上式同时作用于 \(\alpha\) 得
\[(u(\mathcal A)f(\mathcal A))\alpha+(v(\mathcal A)g(\mathcal A))\alpha=\alpha \]而 \(g(\mathcal A)((u(\mathcal A)f(\mathcal A))\alpha)=u(\mathcal A)((f(\mathcal A)g(\mathcal A))\alpha)=u(\mathcal A)(0)=0\),所以 \((u(\mathcal A)f(\mathcal A))\alpha\in \ker g(\mathcal A)\),同理 \((v(\mathcal A)g(\mathcal A))\alpha\in \ker f(\mathcal A)\). 于是 \(\ker f(\mathcal A)g(\mathcal A)\subset\ker f(\mathcal A)+\ker g(\mathcal A).\)
由上可知 \(\ker f(\mathcal A)g(\mathcal A)=\ker f(\mathcal A)+\ker g(\mathcal A).\)
任取 \(\alpha\in \ker f(\mathcal A)\cap\ker g(\mathcal A)\),则
\[\alpha=u(\mathcal A)(f(\mathcal A)\alpha)+v(\mathcal A)(g(\mathcal A)\alpha)=u(\mathcal A)(0)+v(\mathcal A)(0)=0 \]即 \(\ker f(\mathcal A)\cap\ker g(\mathcal A)=\{0\}\),所以 \(\ker f(\mathcal A)g(\mathcal A)=\ker f(\mathcal A)\oplus\ker g(\mathcal A)\).
运用数学归纳法,我们可以得到以下推论
推论 2:若 \(f_1(\lambda),f_2(\lambda),\cdots,f_{s}(\lambda)\in\mathbb F[\lambda]\) 且两两互素,则
\[\ker h(\mathcal A)=\ker f_1(\mathcal A)\oplus\ker f_2(\mathcal A)\oplus\cdots\oplus\ker f_s(\mathcal A) \]其中 \(h(\lambda)=f_1(\lambda)f_2(\lambda)\cdots f_s(\lambda).\)
根据哈密顿-凯莱定理,\(\mathcal A\) 的特征多项式是它的零化多项式,从而如果它能分解成一次因式的乘积
\[f(\lambda)=(\lambda-\lambda_1)^{l_1}(\lambda-\lambda_2)^{l_2}\cdots(\lambda-\lambda_s)^{l_s} \]我们就得到了
\[V=\ker (\mathcal A-\lambda_1\mathcal I)^{l_1}\oplus\ker (\mathcal A-\lambda_2\mathcal I)^{l_2}\oplus\cdots\oplus\ker (\mathcal A-\lambda_s\mathcal I)^{l_s} \]我们称 \(\ker (\mathcal A-\lambda_i\mathcal I)^{l_i}\) 为根子空间,记为 \(W_i\).
令 \(\mathcal B_i=(\mathcal A-\lambda_i\mathcal I)|W_i\),任取 \(\alpha\in W_i\),则 \(\mathcal B_i^{l_i}\alpha=(\mathcal A-\lambda_i\mathcal I)^{l_i}(\alpha)=0\),从而 \(\mathcal B_i\) 是 \(W_i\) 上的幂零变换,因此 \(\mathcal A|W_i\) 可以写成数乘变换与幂零变换的和
\[\mathcal A|W_i=\mathcal B_i+\lambda_i\mathcal I \]下面我们来研究幂零变换的简单矩阵表示.
设 \(\mathcal B\) 是 \(r\) 维线性空间 \(U\) 上的幂零变换,其幂零指数为 \(l\).
我们此前已经知道:任取 \(\alpha\in V\),使得 \(\mathcal B^{l-1}\alpha\ne 0\),则 \(\mathcal B^{l-1}\alpha,\cdots,\mathcal B\alpha,\alpha\) 线性无关,从而有 \(l\le r\).
若 \(\alpha\in V,1\le t\le l\),且 \(\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\) 线性无关,\(\mathcal B^t\alpha=0\),则我们称 \(\langle\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\rangle\) 是 \(\mathcal B-\)强循环子空间,易见它也是 \(\mathcal B-\)不变子空间.
由定义可知,强循环子空间 \(\langle\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\rangle\) 在基 \(\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\) 下的矩阵为 \(t\) 阶矩阵
\[\begin{pmatrix} 0&1&0&\cdots&0&0\\0&0&1&\cdots&0&0\\0&0&0&\cdots&0&0\\\vdots&\vdots&\vdots&&\vdots&\vdots\\0&0&0&\cdots&0&1\\0&0&0&\cdots&0&0\\ \end{pmatrix}\]我们将它记为 \(J_t(0)\),更一般地,我们记 \(J_t(k)=kI_t+J_t(0)\),并称它是一个 \(t\) 阶的约当块.
如果我们能将 \(U\) 分解称 \(\mathcal B-\) 强循环子空间的直和,则 \(\mathcal B\) 在 \(U\) 的某一个基下的矩阵可以写成分块对角矩阵,其中每一个块都是一个 \(t\) 级约当块(\(1\le t\le l\)),我们称这样的矩阵为约当型矩阵.
下面我们通过对 \(r\) 做归纳证明这件事:
(1) 当 \(r=1\) 时,\(1\le l\le r=1\),所以 \(l=1\),于是对于任意 \(\alpha\in V\) 有 \(\mathcal B\alpha=0.\) 任取 \(U\) 的一个基 \(\alpha\),则 \(U=\langle \alpha\rangle\),而 \(\langle\alpha\rangle\) 是 \(\mathcal B-\)强循环子空间.
(2) 若所有维数小于 \(r\) 的线性空间都可以写成其上幂零变换的强循环子空间的直和:
如果 \(l=1\),任取 \(U\) 的一个基 \(\alpha_1,\alpha_2,\cdots,\alpha_r\),则
\[U=\langle\alpha_1\rangle\oplus\langle\alpha_2\rangle\oplus\cdots\oplus\langle\alpha_r\rangle \]其中 \(\langle\alpha_i\rangle\) 是 \(\mathcal B-\) 强循环子空间.
如果 \(l>1\),令
\[W_0=\{\alpha\in V|\mathcal B\alpha=0\} \]一方面,\(W_0\) 是特征值 \(0\) 的特征子空间,因此它不是零子空间;一方面,幂零指数 \(l>1\),所以存在 \(\alpha\in V\) 使得 \(\mathcal B\alpha\ne 0\),因此 \(W_0\ne V\). 从而 \(W_0\) 是非平凡的 \(\mathcal B-\) 不变子空间.
任取 \(W_0\) 的陪集 \(\overline{\alpha}\),则 \(\widetilde{B}^l(\overline{\alpha})=\overline{\mathcal B^l\alpha}=\overline{0}\),从而 \(\widetilde{\mathcal B}\) 是 \(U/W_0\) 上的幂零变换,而 \(U/W_0\) 的维数小于 \(r\),因此它可以写成 \(\widetilde{\mathcal B}-\)强循环子空间的直和.
\[U/W_0=\langle\widetilde{\mathcal B}^{l_1-1}(\overline{\alpha_1}),\cdots,\widetilde{\mathcal B}(\overline{\alpha_1}),\overline{\alpha_1}\rangle\oplus\langle\widetilde{\mathcal B}^{l_2-1}(\overline{\alpha_2}),\cdots,\widetilde{\mathcal B}(\overline{\alpha_2}),\overline{\alpha_2}\rangle\oplus\cdots\oplus\langle\widetilde{\mathcal B}^{l_s-1}(\overline{\alpha_s}),\cdots,\widetilde{\mathcal B}(\overline{\alpha_s}),\overline{\alpha_s}\rangle \]从而
\[U=W_0\oplus\langle\mathcal B^{l_1-1}\alpha_1,\cdots,\mathcal B \alpha_1,\alpha_1\rangle\oplus\cdots\oplus\langle\mathcal B^{l_s-1}\alpha_s,\cdots,\mathcal B\alpha_s,\alpha_s\rangle \]我们有 \(\widetilde{\mathcal B}^{l_i}(\overline{\alpha_i})=W_0\),因此 \(\mathcal B^{l_i}(\alpha_i)\in W_0\),且 \(\mathcal B^{l_i+1}(\alpha_i)=0\).
若线性组合
\[k_1\mathcal B^{l_1}(\alpha_1)+k_2\mathcal B^{l_2}(\alpha_2)+\cdots+k_s\mathcal B^{l_s}(\alpha_s)=0 \]则 $$k_1\widetilde{\mathcal B}^{l_1-1}(\alpha_1)+k_2\widetilde{\mathcal B}^{l_2-1}(\alpha_2)+\cdots+k_s\widetilde{\mathcal B}^{l_s-1}(\alpha_s)=\overline{0}$$
而 \(\widetilde{\mathcal B}^{l_1-1}(\alpha_1),\widetilde{\mathcal B}^{l_1-2}(\alpha_2),\cdots,\widetilde{\mathcal B}^{l_s-1}(\alpha_s)\) 线性无关,从而 \(k_1=k_2=\cdots=k_s=0.\)
因此 \(B^{l_1}(\alpha_1),\mathcal B^{l_2}(\alpha_2),\cdots,\mathcal B^{l_s}(\alpha_s)\) 线性无关,将它扩充成 \(W_0\) 的一个基
于是
\[U=\langle\eta_1\rangle\oplus\langle\eta_2\rangle\oplus\cdots\langle\eta_t\rangle\oplus\langle\mathcal B^{l_1}\alpha_1,\cdots,\mathcal B \alpha_1,\alpha_1\rangle\oplus\cdots\oplus\langle\mathcal B^{l_s}\alpha_s,\cdots,\mathcal B\alpha_s,\alpha_s\rangle \]从而我们将 \(U\) 直和分解成了 \(s+t=\dim W_0\) 个 \(\mathcal B-\)强循环子空间.
由数学归纳法第二原理可知证毕.
所以 \(\mathcal B\) 在 \(U\) 的某一个基下的矩阵是约当型矩阵 \(J\),我们来探讨这个约当型矩阵中每一类约当块的个数.
令 \(N_t\) 为 \(t\) 级约当块的个数,则
\[{\rm rank}(\mathcal B^t)={\rm rank}(J^t)=N_{t+1}+2N_{t+2}+\cdots+(l-t)N_s \]这条等式依赖于我们先前对约当块的研究.
后项差分得 \({\rm rank}(\mathcal B^{t})-{\rm rank}(\mathcal B^{t+1})=N_{t+1}+N_{t+2}+\cdots+N_{s}\),因此
\[N_t=(N_t+N_{t+1}+\cdots+N_s)-(N_{t+1}+\cdots+N_s)={\rm rank} (\mathcal B^{t-1})+{\rm rank}(\mathcal B^{t+1})-2{\rm rank}(\mathcal B^{t}) \]而这仅和 \(\mathcal B\) 有关,从而在不考虑约当块的排列顺序的前提下,这样的约当型矩阵是唯一的,我们称它为 \(\mathcal B\) 的约当标准型.
接下来我们开始探讨特征多项式能分解成一次因式的乘积的线性变换的约当标准型.
先前提到,\(\mathcal A|W_i=\lambda_i\mathcal I+\mathcal B_i\),其中 \(\mathcal B_i\) 是 \(W_i\) 上的幂零变换,从而 \(\mathcal B_i\) 在 \(W_i\) 某一个基下的矩阵是约当型矩阵,于是 \(\mathcal A|W_i\) 在这组基下的矩阵也是约当型矩阵,它的主对角元为 \(\lambda_i\),共含有 \(\dim\ker(\mathcal B_i)=\dim\ker(\mathcal A|W_i-\lambda_i\mathcal I)=\dim\ker(\mathcal A-\lambda_i\mathcal I)=\dim V_{\lambda_i}\) 个约当块,其中 \(\dim V_{\lambda_i}\) 是 \(\lambda_i\) 的几何重数.
且主对角元为 \(\lambda_i\) 的 \(t\) 阶约当块的数量为 \({\rm rank}(\mathcal A-\lambda_i\mathcal I)^{t-1}+{\rm rank}(\mathcal A-\lambda_i\mathcal I)^{t+1}-2{\rm rank}(\mathcal A-\lambda_i\mathcal I)^t.\)
这些基合起来是 \(V\) 的一个基,从而 \(\mathcal A\) 在这组基下的矩阵是约当型矩阵,同样地,在不考虑约当块的排列顺序的情况下,这样的约当型矩阵是唯一的,我们称它为 \(\mathcal A\) 的约当标准型.
同时我们指出,在 \(\mathcal A\) 的约当标准型中,特征值 \(\lambda_i\) 在主对角线出现次数为它的代数重数,主对角元为 \(\lambda_i\) 的约当块的个数为它的几何重数.
标签:标准型,cdots,Jordan,mathcal,alpha,oplus,ker,lambda From: https://www.cnblogs.com/space-of-mistery/p/18448473