首页 > 其他分享 >Jordan 标准型

Jordan 标准型

时间:2024-10-05 21:15:46浏览次数:5  
标签:标准型 cdots Jordan mathcal alpha oplus ker lambda

我们知道,并不是所有线性变换都可以对角化,因为它要求特征多项式能分解成一次因式的乘积,并且特征值的几何重数与代数重数相等。当特征多项式能分解成一次因式的乘积,而特征值的几何重数与代数重数不一定相等时,我们将看到该线性变换仍然在一个基下的矩阵具有简单的形式,且几何重数和代数重数在该形势下被赋予了新的内涵.

下面设 \(V\) 是域 \(\mathbb F\) 上的 \(n\) 维线性空间,\(\mathcal A\) 是其上的线性变换.

定义 1:设 \(W\) 是 \(V\) 的子空间,若 \(a\in W\) 蕴含 \(\mathcal A a\in W\),则称 \(W\) 是 \(\mathcal A-\) 不变子空间.

Remark 1:\(\ker\mathcal A\) 与 \(\rm{Im}\mathcal A\) 均为 \(\mathcal A-\)不变子空间.

Remark 2:\(V\) 与零子空间是平凡的 \(\mathcal A-\)不变子空间.

若 \(W\) 是 \(\mathcal A-\)不变子空间,则 \(\mathcal A\) 可以看成 \(W\) 上的线性变换. 具体地,我们定义 \(\mathcal A|W\) 是 \(W\) 上的线性变换,它在 \(W\) 的每一个向量 \(\alpha\) 上的像为 \(\mathcal A\alpha\),我们用简单的套话即可说明它是良定义的且保持运算.

我们由 \(V\) 的一个 \(\mathcal A-\) 不变子空间 \(W\) 导出商空间 \(V/W\) 上的线性变换 \(\widetilde{A}\),它在每一个 \(W\) 的陪集 \(\overline{\alpha}\) 上的像为 \(\overline{\mathcal A \alpha}\).

若 \(V\) 可以写成不变子空间的直和

\[V=W_1\oplus W_2\oplus\cdots\oplus W_s \]

从 \(W_1,W_2,\cdots,W_s\) 各取一个基,它们合起来是 \(V\) 的一个基,\(\mathcal A\) 在这个基下的矩阵可以写成分块对角矩阵 \({\rm diag}\{A_1,A_2,\cdots,A_s\}\),其中 \(A_i\) 是 \(\mathcal A|W\) 在从 \(W_i\) 取出来的基下的矩阵.

我们接下来的思路是,将 \(V\) 写成非平凡的不变子空间的直和,每一个非平凡的不变子空间都存在一个基,使得 \(\mathcal A\) 限制在这个子空间后在这个基下的矩阵具有简单的形式.

定理 1:若 \(f(\lambda),g(\lambda)\in\mathbb F[\lambda]\),且 \(f(\lambda)\) 与 \(g(\lambda)\) 互素,则

\[\ker f(\mathcal A)g(\mathcal A)=\ker f(\mathcal A)\oplus\ker g(\mathcal A) \]

证明:显然 \(\ker f(\mathcal A),\ker g(\mathcal A)\subset \ker f(\mathcal A)g(\mathcal A)\),因此 \(\ker f(\mathcal A)+\ker g(\mathcal A)\subset \ker f(\mathcal A)g(\mathcal A).\)

因为 \(f(\lambda)\) 与 \(g(\lambda)\) 互素,所以存在 \(u(\lambda),v(\lambda)\in\mathbb F[\lambda]\),使得 \(u(\lambda)f(\lambda)+v(\lambda)g(\lambda)=1\),将 \(\mathcal A\) 代入得

\[u(\mathcal A)f(\mathcal A)+v(\mathcal A)g(\mathcal A)=\mathcal I \]

任取 \(\alpha\in \ker f(\mathcal A)g(\mathcal A)\),将上式同时作用于 \(\alpha\) 得

\[(u(\mathcal A)f(\mathcal A))\alpha+(v(\mathcal A)g(\mathcal A))\alpha=\alpha \]

而 \(g(\mathcal A)((u(\mathcal A)f(\mathcal A))\alpha)=u(\mathcal A)((f(\mathcal A)g(\mathcal A))\alpha)=u(\mathcal A)(0)=0\),所以 \((u(\mathcal A)f(\mathcal A))\alpha\in \ker g(\mathcal A)\),同理 \((v(\mathcal A)g(\mathcal A))\alpha\in \ker f(\mathcal A)\). 于是 \(\ker f(\mathcal A)g(\mathcal A)\subset\ker f(\mathcal A)+\ker g(\mathcal A).\)

由上可知 \(\ker f(\mathcal A)g(\mathcal A)=\ker f(\mathcal A)+\ker g(\mathcal A).\)

任取 \(\alpha\in \ker f(\mathcal A)\cap\ker g(\mathcal A)\),则

\[\alpha=u(\mathcal A)(f(\mathcal A)\alpha)+v(\mathcal A)(g(\mathcal A)\alpha)=u(\mathcal A)(0)+v(\mathcal A)(0)=0 \]

即 \(\ker f(\mathcal A)\cap\ker g(\mathcal A)=\{0\}\),所以 \(\ker f(\mathcal A)g(\mathcal A)=\ker f(\mathcal A)\oplus\ker g(\mathcal A)\).

运用数学归纳法,我们可以得到以下推论

推论 2:若 \(f_1(\lambda),f_2(\lambda),\cdots,f_{s}(\lambda)\in\mathbb F[\lambda]\) 且两两互素,则

\[\ker h(\mathcal A)=\ker f_1(\mathcal A)\oplus\ker f_2(\mathcal A)\oplus\cdots\oplus\ker f_s(\mathcal A) \]

其中 \(h(\lambda)=f_1(\lambda)f_2(\lambda)\cdots f_s(\lambda).\)

根据哈密顿-凯莱定理,\(\mathcal A\) 的特征多项式是它的零化多项式,从而如果它能分解成一次因式的乘积

\[f(\lambda)=(\lambda-\lambda_1)^{l_1}(\lambda-\lambda_2)^{l_2}\cdots(\lambda-\lambda_s)^{l_s} \]

我们就得到了

\[V=\ker (\mathcal A-\lambda_1\mathcal I)^{l_1}\oplus\ker (\mathcal A-\lambda_2\mathcal I)^{l_2}\oplus\cdots\oplus\ker (\mathcal A-\lambda_s\mathcal I)^{l_s} \]

我们称 \(\ker (\mathcal A-\lambda_i\mathcal I)^{l_i}\) 为根子空间,记为 \(W_i\).

令 \(\mathcal B_i=(\mathcal A-\lambda_i\mathcal I)|W_i\),任取 \(\alpha\in W_i\),则 \(\mathcal B_i^{l_i}\alpha=(\mathcal A-\lambda_i\mathcal I)^{l_i}(\alpha)=0\),从而 \(\mathcal B_i\) 是 \(W_i\) 上的幂零变换,因此 \(\mathcal A|W_i\) 可以写成数乘变换与幂零变换的和

\[\mathcal A|W_i=\mathcal B_i+\lambda_i\mathcal I \]

下面我们来研究幂零变换的简单矩阵表示.

设 \(\mathcal B\) 是 \(r\) 维线性空间 \(U\) 上的幂零变换,其幂零指数为 \(l\).

我们此前已经知道:任取 \(\alpha\in V\),使得 \(\mathcal B^{l-1}\alpha\ne 0\),则 \(\mathcal B^{l-1}\alpha,\cdots,\mathcal B\alpha,\alpha\) 线性无关,从而有 \(l\le r\).

若 \(\alpha\in V,1\le t\le l\),且 \(\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\) 线性无关,\(\mathcal B^t\alpha=0\),则我们称 \(\langle\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\rangle\) 是 \(\mathcal B-\)强循环子空间,易见它也是 \(\mathcal B-\)不变子空间.

由定义可知,强循环子空间 \(\langle\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\rangle\) 在基 \(\mathcal B^{t-1}\alpha,\cdots,\mathcal B\alpha,\alpha\) 下的矩阵为 \(t\) 阶矩阵

\[\begin{pmatrix} 0&1&0&\cdots&0&0\\0&0&1&\cdots&0&0\\0&0&0&\cdots&0&0\\\vdots&\vdots&\vdots&&\vdots&\vdots\\0&0&0&\cdots&0&1\\0&0&0&\cdots&0&0\\ \end{pmatrix}\]

我们将它记为 \(J_t(0)\),更一般地,我们记 \(J_t(k)=kI_t+J_t(0)\),并称它是一个 \(t\) 阶的约当块.

如果我们能将 \(U\) 分解称 \(\mathcal B-\) 强循环子空间的直和,则 \(\mathcal B\) 在 \(U\) 的某一个基下的矩阵可以写成分块对角矩阵,其中每一个块都是一个 \(t\) 级约当块(\(1\le t\le l\)),我们称这样的矩阵为约当型矩阵.

下面我们通过对 \(r\) 做归纳证明这件事:

(1) 当 \(r=1\) 时,\(1\le l\le r=1\),所以 \(l=1\),于是对于任意 \(\alpha\in V\) 有 \(\mathcal B\alpha=0.\) 任取 \(U\) 的一个基 \(\alpha\),则 \(U=\langle \alpha\rangle\),而 \(\langle\alpha\rangle\) 是 \(\mathcal B-\)强循环子空间.

(2) 若所有维数小于 \(r\) 的线性空间都可以写成其上幂零变换的强循环子空间的直和:

如果 \(l=1\),任取 \(U\) 的一个基 \(\alpha_1,\alpha_2,\cdots,\alpha_r\),则

\[U=\langle\alpha_1\rangle\oplus\langle\alpha_2\rangle\oplus\cdots\oplus\langle\alpha_r\rangle \]

其中 \(\langle\alpha_i\rangle\) 是 \(\mathcal B-\) 强循环子空间.

如果 \(l>1\),令

\[W_0=\{\alpha\in V|\mathcal B\alpha=0\} \]

一方面,\(W_0\) 是特征值 \(0\) 的特征子空间,因此它不是零子空间;一方面,幂零指数 \(l>1\),所以存在 \(\alpha\in V\) 使得 \(\mathcal B\alpha\ne 0\),因此 \(W_0\ne V\). 从而 \(W_0\) 是非平凡的 \(\mathcal B-\) 不变子空间.

任取 \(W_0\) 的陪集 \(\overline{\alpha}\),则 \(\widetilde{B}^l(\overline{\alpha})=\overline{\mathcal B^l\alpha}=\overline{0}\),从而 \(\widetilde{\mathcal B}\) 是 \(U/W_0\) 上的幂零变换,而 \(U/W_0\) 的维数小于 \(r\),因此它可以写成 \(\widetilde{\mathcal B}-\)强循环子空间的直和.

\[U/W_0=\langle\widetilde{\mathcal B}^{l_1-1}(\overline{\alpha_1}),\cdots,\widetilde{\mathcal B}(\overline{\alpha_1}),\overline{\alpha_1}\rangle\oplus\langle\widetilde{\mathcal B}^{l_2-1}(\overline{\alpha_2}),\cdots,\widetilde{\mathcal B}(\overline{\alpha_2}),\overline{\alpha_2}\rangle\oplus\cdots\oplus\langle\widetilde{\mathcal B}^{l_s-1}(\overline{\alpha_s}),\cdots,\widetilde{\mathcal B}(\overline{\alpha_s}),\overline{\alpha_s}\rangle \]

从而

\[U=W_0\oplus\langle\mathcal B^{l_1-1}\alpha_1,\cdots,\mathcal B \alpha_1,\alpha_1\rangle\oplus\cdots\oplus\langle\mathcal B^{l_s-1}\alpha_s,\cdots,\mathcal B\alpha_s,\alpha_s\rangle \]

我们有 \(\widetilde{\mathcal B}^{l_i}(\overline{\alpha_i})=W_0\),因此 \(\mathcal B^{l_i}(\alpha_i)\in W_0\),且 \(\mathcal B^{l_i+1}(\alpha_i)=0\).

若线性组合

\[k_1\mathcal B^{l_1}(\alpha_1)+k_2\mathcal B^{l_2}(\alpha_2)+\cdots+k_s\mathcal B^{l_s}(\alpha_s)=0 \]

则 $$k_1\widetilde{\mathcal B}^{l_1-1}(\alpha_1)+k_2\widetilde{\mathcal B}^{l_2-1}(\alpha_2)+\cdots+k_s\widetilde{\mathcal B}^{l_s-1}(\alpha_s)=\overline{0}$$
而 \(\widetilde{\mathcal B}^{l_1-1}(\alpha_1),\widetilde{\mathcal B}^{l_1-2}(\alpha_2),\cdots,\widetilde{\mathcal B}^{l_s-1}(\alpha_s)\) 线性无关,从而 \(k_1=k_2=\cdots=k_s=0.\)
因此 \(B^{l_1}(\alpha_1),\mathcal B^{l_2}(\alpha_2),\cdots,\mathcal B^{l_s}(\alpha_s)\) 线性无关,将它扩充成 \(W_0\) 的一个基

\[B^{l_1}(\alpha_1),\mathcal B^{l_2}(\alpha_2),\cdots,\mathcal B^{l_s}(\alpha_s),\eta_1,\eta_2,\cdots,\eta_t \]

于是

\[U=\langle\eta_1\rangle\oplus\langle\eta_2\rangle\oplus\cdots\langle\eta_t\rangle\oplus\langle\mathcal B^{l_1}\alpha_1,\cdots,\mathcal B \alpha_1,\alpha_1\rangle\oplus\cdots\oplus\langle\mathcal B^{l_s}\alpha_s,\cdots,\mathcal B\alpha_s,\alpha_s\rangle \]

从而我们将 \(U\) 直和分解成了 \(s+t=\dim W_0\) 个 \(\mathcal B-\)强循环子空间.

由数学归纳法第二原理可知证毕.

所以 \(\mathcal B\) 在 \(U\) 的某一个基下的矩阵是约当型矩阵 \(J\),我们来探讨这个约当型矩阵中每一类约当块的个数.

令 \(N_t\) 为 \(t\) 级约当块的个数,则

\[{\rm rank}(\mathcal B^t)={\rm rank}(J^t)=N_{t+1}+2N_{t+2}+\cdots+(l-t)N_s \]

这条等式依赖于我们先前对约当块的研究.

后项差分得 \({\rm rank}(\mathcal B^{t})-{\rm rank}(\mathcal B^{t+1})=N_{t+1}+N_{t+2}+\cdots+N_{s}\),因此

\[N_t=(N_t+N_{t+1}+\cdots+N_s)-(N_{t+1}+\cdots+N_s)={\rm rank} (\mathcal B^{t-1})+{\rm rank}(\mathcal B^{t+1})-2{\rm rank}(\mathcal B^{t}) \]

而这仅和 \(\mathcal B\) 有关,从而在不考虑约当块的排列顺序的前提下,这样的约当型矩阵是唯一的,我们称它为 \(\mathcal B\) 的约当标准型.

接下来我们开始探讨特征多项式能分解成一次因式的乘积的线性变换的约当标准型.

先前提到,\(\mathcal A|W_i=\lambda_i\mathcal I+\mathcal B_i\),其中 \(\mathcal B_i\) 是 \(W_i\) 上的幂零变换,从而 \(\mathcal B_i\) 在 \(W_i\) 某一个基下的矩阵是约当型矩阵,于是 \(\mathcal A|W_i\) 在这组基下的矩阵也是约当型矩阵,它的主对角元为 \(\lambda_i\),共含有 \(\dim\ker(\mathcal B_i)=\dim\ker(\mathcal A|W_i-\lambda_i\mathcal I)=\dim\ker(\mathcal A-\lambda_i\mathcal I)=\dim V_{\lambda_i}\) 个约当块,其中 \(\dim V_{\lambda_i}\) 是 \(\lambda_i\) 的几何重数.

且主对角元为 \(\lambda_i\) 的 \(t\) 阶约当块的数量为 \({\rm rank}(\mathcal A-\lambda_i\mathcal I)^{t-1}+{\rm rank}(\mathcal A-\lambda_i\mathcal I)^{t+1}-2{\rm rank}(\mathcal A-\lambda_i\mathcal I)^t.\)

这些基合起来是 \(V\) 的一个基,从而 \(\mathcal A\) 在这组基下的矩阵是约当型矩阵,同样地,在不考虑约当块的排列顺序的情况下,这样的约当型矩阵是唯一的,我们称它为 \(\mathcal A\) 的约当标准型.

同时我们指出,在 \(\mathcal A\) 的约当标准型中,特征值 \(\lambda_i\) 在主对角线出现次数为它的代数重数,主对角元为 \(\lambda_i\) 的约当块的个数为它的几何重数.

标签:标准型,cdots,Jordan,mathcal,alpha,oplus,ker,lambda
From: https://www.cnblogs.com/space-of-mistery/p/18448473

相关文章

  • 线性代数 第七讲 二次型_标准型_规范型_坐标变换_合同_正定二次型详细讲解_重难点题型
    文章目录1.二次型1.1二次型、标准型、规范型、正负惯性指数、二次型的秩1.2坐标变换1.3合同1.4正交变换化为标准型2.二次型的主要定理3.正定二次型与正定矩阵4.重难点题型总结4.1配方法将二次型化为标准型4.2正交变换法将二次型化为标准型4.3规范型确定取值范围......
  • 为什么Python库中还没有Gauss-Jordan消去函数?
    Gaussian-Jordan消除法是一种常用且方便的技术。在矩阵计算中,该方法得到广泛应用。但是,Python库中没有此方法的内置函数。设计这样的功能并不困难。开发人员似乎忽略了这个功能。这可能是什么原因?希望开发者能够重视这一点,并开发与该方法相关的功能。虽然高斯-约旦消元......
  • 矩阵常识与jordan标准型
    1.换基过渡矩阵,坐标变换公式        [y1,y2,y3]=[x1,x2,x3]C #y为新基,x为旧基,注意y1对应于C中的一列    新坐标= 旧坐标2.线性变换的矩阵表示,在不同基下的矩阵表示                关于矩阵A的最小零化多项式:最小多项式(最高次......
  • 相似标准型 总结
    ......
  • λ-矩阵的相抵标准型
    \(\S1\行列式因子\)Def\(\color{red}{Def}设\lambda-矩阵A(\lambda)\inM_{m\timesn}(\mathbb{F[\lambda]})的秩为r,对于正整数k,1\leqk\leqr,A(\lambda)中必有非零的k级子式.A(\lambda)的全部k级子式的最大公因式D_k(A(\lambda))称为A(\lambda)的\color{red}{k级行列式......
  • 有理标准型与Jordan标准型
    $\S$1.有理标准型思想:数域\(\mathbb{F}\)上的\(n\)阶矩阵的相似等价类由矩阵的不变因子或者初等因子确定,我们可以利用初等因子在每个相似等价类中找一个形式简单的代表矩阵。\(\color{red}{Def}\)设\[f(\lambda)=\lambda^n+b_1\lambda_{n-1}+...+b_{n-1}\lambda+b_n\in\mat......
  • 矩阵化为行阶梯型、行最简阶梯型、标准型、单位矩阵的方法
    1.行阶梯型1.1形式若有0行,都在下方从行上看,从左边起,出现连续的0的个数自上而下,严格单调增加1.2方法\[\left[\begin{matrix}1&-1&2&1&0\\2&-2&4&2&0\\3&0&6&-1&1\\0&3&0&0&1\end{matrix}\right]\]通过行变换将第一列尽量都变成0......
  • 非线性规划——非线性规划的标准型(一)
    非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。20世纪50年代初,库哈(H.W.Kuhn)和托克(A.W.Tucker)提出了非线性规划的基本定理,为非线性规划奠定了理论基础。20世纪80年代以来,随着计算机技术的快速发展,非线性规划方......
  • 线性代数复习:Jordan 标准型
    本学期的“高等代数(实验班)”以PID上的有限生成模结构定理导出Jordan标准型理论,由于这实在太魔怔所以绝版了,在这里记录一下以表怀念(本文假定读者熟悉基本的环论知识,参考了《代数学方法》以及香蕉空间等网络资料.对于交换环\(R\),定义\(R\)-模是指交换群\((M,+......
  • 矩阵笔记2:矩阵分析(第三版)-史荣昌-第二章:λ-矩阵与矩阵的Jordan标准型
    文章目录​​0笔记说明​​​​1书本内容​​​​1.1λ-矩阵及标准型​​​​1.2初等因子与相似条件​​​​1.3矩阵的Jordan标准型​​​​1.4矩阵的有理标准型​​......