分块矩阵法是高等代数中处理矩阵相关问题的最重要的方法之一, 其重要性可以说怎么强调都不过分. 分块矩阵法的核心思想是根据具体问题构造适当的分块矩阵, 然后运用广义初等变换, 将某些子块消为零块, 得到特殊的分块矩阵从而解决问题. 该方法几乎贯穿了线性代数的始终, 在矩阵求逆、矩阵秩不等式、行列式、线性方程组、线性变换、二次型等方面有着广泛的应用.
例如, 证明行列式的乘法公式\(|AB|=|A|\cdot |B|\)时, 我们就构造了分块矩阵
\[\left(\begin{array}{cc} A&O \\ -E& B \end{array}\right). \]作广义初等变换
\[\left(\begin{array}{cc} A&O \\ -E& B \end{array}\right) \stackrel{c_1\cdot B+c_2}{\longrightarrow} \left(\begin{array}{cc} A&AB \\ -E& O \end{array}\right) \stackrel{r_1\leftrightarrow r_2}{\longrightarrow} \left(\begin{array}{cc} -E& O\\ A&AB \end{array}\right). \]取行列式, 得
\[|A|\cdot |B|=\left|\begin{array}{cc} A&O \\ -E& B \end{array}\right|=(-1)^n \left|\begin{array}{cc} -E& O\\ A&AB \end{array}\right|=(-1)^n|-E_n|\cdot |AB|, \]即\(|AB|=|A|\cdot |B|\).
再例如, 若子矩阵块\(A\)可逆,利用初等变换将分块矩阵\(\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)\)
的子块\(C\)消成\(O\), 即
得到行列式
\[\left|\begin{array}{cc} A&B\\ C& D \end{array}\right| =\left|\begin{array}{cc} A&B \\ O& D-CA^{-1}B \end{array}\right|=|A|\cdot|D-CA^{-1}B|. \]该式有时也称为行列式的降阶公式.
\(\S1\) 由于广义初等变换不改变矩阵的秩,所以 关于矩阵秩的等式或不等式的证明, 分块矩阵法可以大显神通. 使用该方法的主要思路是根据等式或不等式的一边构造合适的分块矩阵,对其实施分块矩阵的初等变换,得到等式或不等式的另一边的秩关系.
例1 设\(A_{m\times n}\,,\,B_{n\times l}\), 则\({\rm r}(AB)\leqslant \min\{{\rm r}(A),{\rm r}(B)\}\).
证明 由于
\[(A,\; AB)\left(\begin{array}{cc} E&-B\\ O&E \end{array}\right)= (A,\; O),\quad \left(\begin{array}{cc} E&O\\ -A&E \end{array}\right) \left(\begin{array}{c} B\\ AB \end{array}\right) =\left(\begin{array}{c} B\\ O \end{array}\right), \]所以
\[\begin{array}{c} {\rm r}(AB)\leqslant {\rm r}(A,\; AB)={\rm r}(A,\; O)={\rm r}(A),\;\\ {\rm r}(AB)\leqslant {\rm r}\left(\begin{array}{c} B\\ AB \end{array}\right)={\rm r}\left(\begin{array}{c} B\\ O \end{array}\right)={\rm r}(B), \end{array} \]即\({\rm r}(AB)\leqslant \min\{{\rm r}(A),{\rm r}(B)\}\).
例2 \({\rm r}(A)+{\rm r}(B)={\rm r}\begin{pmatrix}A&O\\O&B \end{pmatrix}\leqslant {\rm r}\begin{pmatrix}A&O\\C&B\end{pmatrix}\,\).
证明 设\({\rm r}(A)=r_1\), \({\rm r}(B)=r_2\), 则存在可逆矩阵\(P_1,Q_1\) 与\(P_2, Q_2\) 使得
\[P_1AQ_1=\begin{pmatrix}E_{r_1}&\\ &O\end{pmatrix}, \qquad P_2BQ_2=\begin{pmatrix}E_{r_2}&\\ &O\end{pmatrix}. \]从而
\[\begin{pmatrix}P_1&\\ &P_2\end{pmatrix} \begin{pmatrix}A&\\ &B\end{pmatrix} \begin{pmatrix}Q_1&\\ &Q_2\end{pmatrix} =\left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline &&E_{r_2}&\\ &&&O\end{array}\right). \]所以由(1)得
\[{\rm r}\begin{pmatrix}A&\\ &B\end{pmatrix}=r_1+r_2={\rm r}(A)+{\rm r}(B). \]另一方面, 由于通过初等变换,
\[\begin{array}{rl} &\begin{pmatrix}A&O\\ C&B\end{pmatrix}\rightarrow \left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline D_{11}&D_{12}&E_{r_2}&\\ D_{21}&D_{22}&&O\end{array}\right)\\ \rightarrow & \left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline O&O&E_{r_2}&\\ O&D&&O\end{array}\right)\rightarrow \left(\begin{array}{cccc}E_{r_1}&&&\\ &E_{r_2}&&\\ &&D&\\&&&O\end{array}\right), \end{array} \]所以
\[{\rm r}\begin{pmatrix}A&O\\ C&B\end{pmatrix}=r_1+r_2+{\rm r}(D)\geqslant r_1+r_2={\rm r}(A)+{\rm r}(B). \]例3 若\(A,B\)是同阶矩阵,则
\(|{\rm r}(A)-{\rm r}(B)|\leqslant {\rm r}(A\pm B)\leqslant
{\rm r}(A)+{\rm r}(B)\).
证明 由于
\[\begin{pmatrix}A&\\ &B\end{pmatrix}\rightarrow \begin{pmatrix}A&O\\ A&B\end{pmatrix}\rightarrow \begin{pmatrix}A&A\\ A&A+B\end{pmatrix}, \]所以
\[{\rm r}(A+B)\leqslant {\rm r}\begin{pmatrix}A&A\\ A&A+B\end{pmatrix} ={\rm r}\begin{pmatrix}A&\\ &B\end{pmatrix}={\rm r}(A)+{\rm r}(B). \]另一方面, 不妨设\({\rm r}(A)\geqslant {\rm r}(B)\), 则由
\[\begin{pmatrix}A+B&\\ &B\end{pmatrix}\rightarrow \begin{pmatrix}A+B&B\\ O&B\end{pmatrix}\rightarrow \begin{pmatrix}A&B\\ -B&B\end{pmatrix}, \]可得
\[{\rm r}(A)\leqslant {\rm r}\begin{pmatrix}A&B\\ -B&B\end{pmatrix} ={\rm r}\begin{pmatrix}A+B&\\ &B\end{pmatrix} ={\rm r}(A+B)+{\rm r}(B), \]即
\[{\rm r}(A)-{\rm r}(B)\leqslant {\rm r}(A+B). \]而且,
\[{\rm r}(A)={\rm r}(A-B+B)\leqslant{\rm r}(A-B)+{\rm r}(B)\,, \]所以 \({\rm r}(A)-{\rm r}(B)\leqslant{\rm r}(A-B)\),.
类似地,
所以
\(|{\rm r}(A)-{\rm r}(B)|\leqslant{\rm r}(A-B)\),,
故
例4 [第一降阶定理]
设\(A\)是可逆矩阵, \(\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)\)是\((r,m-r)\times (r,m-r)\)分块矩阵. 证明\({\rm r}\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B)\).
证明 因为
\[\left(\begin{array}{cc} E_r&O \\ -CA^{-1}& E_{m-r} \end{array}\right) \left(\begin{array}{cc} A&B \\ C& D \end{array}\right) \left(\begin{array}{cc} E_r&-A^{-1}B \\ O& E_{m-r} \end{array}\right)= \left(\begin{array}{cc} A&O \\ O& D-CA^{-1}B \end{array}\right), \]且\(\left(\begin{array}{cc} E_r&O \\ -CA^{-1}& E_{m-r} \end{array}\right)\)与\(\left(\begin{array}{cc} E_r&-A^{-1}B \\ O& E_{m-r} \end{array}\right)\)都是非异矩阵, 所以
\[{\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B). \]例5 [第二降阶定理]
设\(A,D\)分别是\(r,s\)阶非奇异矩阵, \(B\in F^{r\times s}\), \(C\in F^{s\times r}\), 则
证明 由第一讲解定理得
\[{\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B). \]另一方面, 由\(D\)非奇异知
\[\left(\begin{array}{cc} E_r&-BD^{-1} \\ O& E_{m-r} \end{array}\right) \left(\begin{array}{cc} A&B \\ C& D \end{array}\right) \left(\begin{array}{cc} E_r&O \\ -D^{-1}C& E_{m-r} \end{array}\right)= \left(\begin{array}{cc} A-BD^{-1}C&O \\ O& D \end{array}\right), \]所以
\[{\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(D)+{\rm r}(A-BD^{-1}C). \]故
\[{\rm r}(D-CA^{-1}B)={\rm r}(D)-{\rm r}(A)+{\rm r}(A-BD^{-1}C). \]例6 设\(A\)是\(m\times n\)矩阵, 证明
\[{\rm r}(E_m-AA^T)-{\rm r}(E_n-A^TA)=m-n. \]*证明 由\ref{No.2-RedOrder}知
\[\begin{array}{rl} {\rm r}(E_m-AA^T)={\rm r}(E_m-AE_nA^T)&={\rm r}(E_m)-{\rm r}(E_n)+{\rm r}(E_n-A^TE_mA)\\ &=m-n+{\rm r}(E_n-A^TA). \end{array} \]即
\[{\rm r}(E_m-AA^T)-{\rm r}(E_n-A^TA)=m-n. \]例7 [Sylvester不等式]
设\(A,B\)为\(n\)阶方阵,则\({\rm r}(A)+{\rm r}(B)\leqslant
{\rm r}(AB)+n\).
** 证明** 对分块矩阵作广义初等变换, $$\begin{pmatrix}A&O\E&B\end{pmatrix}\rightarrow\begin{pmatrix}O&-AB\
E&B\end{pmatrix}\rightarrow\begin{pmatrix}O&-AB\
E&O\end{pmatrix}\rightarrow\begin{pmatrix}E&O\O&AB\end{pmatrix},.$$
由(3)得
即
\[{\rm r}(A)+{\rm r}(B)-n\leqslant{\rm r}(AB). \]例[8 复旦大学1999,武汉大学2001,厦门大学2001,北京理工大学2003,西安电子科技大学2004,浙江大学2007,北京大学2009,中南大学2010,兰州大学2020]
设\(A,B,C\)分别是\(m\times n, n\times s, s\times t\)矩阵. 证明Frobenius不等式
证明 (方法一) 利用分块初等变换,考虑
\[\left(\begin{array}{cc} ABC&O\\ O& B \end{array}\right)\rightarrow \left(\begin{array}{cc} ABC&AB\\ O& B \end{array}\right)\rightarrow \left(\begin{array}{cc} O&AB\\ -BC& B \end{array}\right)\rightarrow \left(\begin{array}{cc} AB&O\\ B& BC \end{array}\right), \]于是
\[\begin{array}{rl} {\rm r}(ABC)+{\rm r}(B)=&{\rm r}\left(\begin{array}{cc} ABC&O\\ O& B \end{array}\right) ={\rm r}\left(\begin{array}{cc} AB&O\\ B& BC \end{array}\right)\\ \geqslant& {\rm r}\left(\begin{array}{cc} AB&O\\ O& BC \end{array}\right) ={\rm r}(AB)+{\rm r}(BC). \end{array} \](方法二) 利用满秩分解与Sylvester不等式. 设\({\rm r}(B)=r\), 则存在行、列满秩矩阵\(H,L\)使得\(B=LH\). 则
\[\begin{aligned} {\rm r}(ABC)={\rm r}(ALHC)& \geqslant {\rm r}(AL)+{\rm r}(HC)-r\\ &\geqslant {\rm r}(AB)+{\rm r}(BC)-{\rm r}(B). \end{aligned} \]下面的例子中, 由于\(A+B\)未必可逆,所以下面的一步使用的不是(广义)初等变换
\[\begin{pmatrix} A+B&\\ &E \end{pmatrix} \begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \xlongequal{\mbox{左乘}(A+B)} \begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix} \]由于矩阵乘积的秩不大于每一个因子的秩,所以
\[{\rm r}\begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \geqslant \begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix} \]例9 [武汉大学2008]
设\(A,B\)是数域\(\mF\)上的\(n\)阶方阵,\(AB=BA\). 证明:
\({\rm r}(A+B)\leqslant {\rm r}(A)+{\rm r}(B)-{\rm r}(AB)\).
证明 (方法一) 利用线性方程组与维数公式,参见\ref{Sum-Product-rank}或\ref{Rank-dim}.
(方法二)
因为
由于\(A+B\)未必可逆,所以左乘\(A+B\)不是初等变换,从而
\[\begin{aligned} {\rm r}(A)+{\rm r}(B)= &{\rm r}\begin{pmatrix} A&O\\ O&B \end{pmatrix} ={\rm r}\begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \geqslant {\rm r}\begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix}\\ =& {\rm r}\begin{pmatrix} AB&O\\ -B&A+B \end{pmatrix}\geqslant \begin{pmatrix} AB&O\\ O&A+B \end{pmatrix} ={\rm r}(AB)+{\rm r}(A+B). \end{aligned} \]例10 设\(A,B\)是\(m\times n, n\times m\)矩阵,证明
\[{\rm r}(A-ABA)={\rm r}(A)+{\rm r}(E_n-BA)-n. \]证明 因为
\[\begin{aligned} \begin{pmatrix} A&O\\ O&E_n-BA \end{pmatrix} &\rightarrow \begin{pmatrix} A&O\\ BA&E_n-BA \end{pmatrix} \rightarrow \begin{pmatrix} A&A\\ BA&E_n \end{pmatrix}\\ &\rightarrow \begin{pmatrix} A-ABA&O\\ BA&E_n \end{pmatrix} \rightarrow \begin{pmatrix} A-ABA&O\\ O&E_n \end{pmatrix} \end{aligned} \]所以
\[{\rm r}(A)+{\rm r}(E_n-BA)= {\rm r}\begin{pmatrix} A&O\\ O&E_n-BA \end{pmatrix}={\rm r} \begin{pmatrix} A-ABA&O\\ O&E_n \end{pmatrix}={\rm r}(A-ABA)+n. \]\(\S2\) 由于矩阵的标准形(等价标准形、Jordan 标准形、Frobenius标准形)都是分块矩阵,因此运用标准形解决矩阵问题常常结合分块矩阵的方法.
例11 设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,则\(A,B\)没有公共特征值当且仅当矩阵方程\(AX=XB\)只有零解.
** 证明**
必要性:(反证法)假设\(X_0\)是\(AX=XB\)的非零解,设存在可逆矩阵\(P,Q\)使得
由\(AX_0=X_0B\)得到
\[(PAP^{-1})(PX_0Q)=(PX_0Q)(Q^{-1}BQ). \]设
\[PAP^{-1}=\begin{pmatrix} A_1&A_2\\ A_3&A_4\end{pmatrix}, Q^{-1}BQ=\begin{pmatrix} B_1&B_2\\ B_3&B_4\end{pmatrix}, \]则
\[\begin{pmatrix} A_1&A_2\\ A_3&A_4\end{pmatrix}\begin{pmatrix} E_r&O\\ O&O\end{pmatrix}=\begin{pmatrix} E_r&O\\ O&O\end{pmatrix} \begin{pmatrix} B_1&B_2\\ B_3&B_4 \end{pmatrix}, \]即
\[\begin{pmatrix} A_1&O\\ A_3&O\end{pmatrix}= \begin{pmatrix} B_1&B_2\\ O&O\end{pmatrix}. \]从而可得\(A_1=B_1, A_3=O, B_2=O\). 从而\(A_1=B_1\)的特征值是\(A,B\)的公共特征值,矛盾!所以\(AX=XB\)只有零解.
充分性:(反证法)假设\(\lambda_0\)是\(A,B\)的公共特征值,因为\(f_B(\lambda)=f_{B^T}(\lambda)\), 所以\(\lambda_0\)也是\(A,B^T\)的公共特征值, 故存在可逆矩阵\(P,Q\)使得
\[P^{-1}AP =\begin{pmatrix} \lambda_0&A_2\\ 0&A_4\end{pmatrix}, Q^{-1}B^TQ=\begin{pmatrix} \lambda_0&B_2\\ 0&B_4\end{pmatrix}, \]从而
\[A=P\begin{pmatrix} \lambda_0&A_2\\ 0&A_4\end{pmatrix}P^{-1}, B=(Q^T)^{-1} \begin{pmatrix} \lambda_0&0\\ B_2^T&B_4^T\end{pmatrix}Q^T. \]令\(X_0=P\begin{pmatrix} 1&0\\ 0&O\end{pmatrix}Q^T\ne O\), 则\(AX_)=X_0B\), 矛盾!所以\(A,B\)没有公共特征值.
注 该例的几何解法参见\ref{Comon-Eigen}. 该例的结论可用于解决如下问题:
1、\(A,B\)没有公共特征值\(\Leftrightarrow\) \((f_A(\lambda), f_B(\lambda))=1\) \(\Leftrightarrow\) \(f_B(A)\)可逆 \(\Leftrightarrow\) 矩阵方程\(AX=XB\)只有零解 \(\Leftrightarrow\)线性变换\(\sigma: \mathbb{C}^{m\times n}\rightarrow \mathbb{C}^{m\times n}, X\mapsto AX-XB\)可逆.
2、(中国科学技术大学,2013)设\(A,B\)是\(n\)阶复方阵,\(\mathbb{C}^{n\times n}\)上的线性变换\(\A: X\mapsto AX-XB\). 证明:\(\A\)可逆的充分必要条件是\(A\)和\(B\)无公共特征值.
3、(武汉大学,2013)设\(\lambda_1,\lambda_2,\cdots,\lambda_n\)是\(n\)阶实方阵\(A\)的全部特征值,但\(-\lambda_i(i=1,2,\cdots,n)\)不是\(A\)的特征值. 定义\(\mathbb{R}^{n\times n}\)的线性变换
\[\sigma(X)=A^TX+XA,\quad \forall X\in\mathbb{R}^{n\times n}. \]证明:(1) \(\sigma\)是可逆线性变换;
(2) 对任意实对称矩阵\(C\), 存在唯一的实对称矩阵\(B\)使得\(A^TB+BA=C\).
证明
(1) 只需证明\(\sigma\)是单射. 设\(\sigma(X)=A^TX+XA=O\), 则\(XA=-A^TX\), 于是
由于\(-\lambda_i(i=1,2,\cdots,n)\)不是\(A\)的特征值, 所以\(f_A(-A^T)\)可逆,从而\(X=O\), \(\sigma\)是单射,从而是双射,故可逆.
(2) 由(1)知存在唯一的矩阵\(B\)使得\(\sigma(B)=C\). 由于
\[\sigma(B^T)=A^TB^T+B^TA=(A^TB+BA)^T=C^T=C, \]所以\(B^T=B\), 即\(B\)是对称矩阵.
4、设\(A,B\)分别是\(m,n\)阶方阵,\(C\)是\(m\times n\)阶矩阵. 证明:\(AX+XB=C\)有唯一解的充要条件是对\(A,B\)的任一特征值\(\lambda_i,\mu_j\), 都有\(\lambda_i+\mu_j\ne 0\).
(提示:只需证\(AX+XB=O\)只有零解当且仅当\(\lambda_i+\mu_j\ne 0\), 这等价于\(AX-XB=O\)只有零解当且仅当\(A,B\)没有公共特征值.)
矩阵方程\(AX-XB=C\)称为Sylvester方程,在控制理论中有着重要应用.
例12
设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,且\(A,B\)没有公共特征值,对任意的\(C\in\mathbb{C}^{m\times n}\), 若矩阵方程\(AX-XB=C\)有解,则有唯一解.
证明 (反证法) 假设矩阵方程\(AX-XB=C\)有两个不同的解\(X_1,X_2\), 则\(X_1-X_2\)矩阵方程\(AX-XB=O\)的非零解,与\ref{ComEigen-Equ} 矛盾!所以 矩阵方程\(AX-XB=C\)有唯一解.
注[Roth第二定理]
矩阵方程\(AX-XB=C\)有解当且仅当\(\begin{pmatrix} A&C\\ O&B\end{pmatrix}\)与\(
\begin{pmatrix} A&O\\ O&B\end{pmatrix}\)相似,见\ref{SoluAX-XB=C}.
**例13 ** 设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,若\(A,B\)没有公共特征值,则\(D=\begin{pmatrix} A&C\\ O&B \end{pmatrix}\)可对角化当且仅当\(A,B\)可对角化.
** 证明** 因为\(A,B\)没有公共特征值,所以矩阵方程\(AX-XB=C\)有唯一解,设为\(X_0\). 由于
\[\begin{pmatrix} E&X_0\\ O&E \end{pmatrix}\begin{pmatrix} A&C\\ O&B \end{pmatrix} \begin{pmatrix} E&X_0\\ O&E \end{pmatrix}^{-1}= \begin{pmatrix} A&-AX_0+X_0B+C\\ O&B \end{pmatrix}= \begin{pmatrix} A&O\\ O&B \end{pmatrix}, \]所以\(D\)可对角化当且仅当\(A,B\)可对角化.
例14 设\(A,B\)分别是复数域\(\mathbb{C}\)上的\(n\)阶与\(m\)阶矩阵, \(0<r\leqslant \min\{n,m\}\). 证明:如果\(AX-XB=O\)有秩为\(r\) 的矩阵解, 则\(A\) 与\(B\)至少有\(r\)个公共特征值(重根按重数计算).
证明 设\(C\)是\(AX-XB=O\)的矩阵解, 且\({\rm r}(C)=r\). 则存在可逆矩阵\(P\in \mathbb{C}^{n\times n}\), \(Q\in \mathbb{C}^{m\times m}\), 使得
\[C=P\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)Q. \]由于\(AC=CB\), 所以
\[AP\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)Q= P\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)QB,\]从而
\[P^{-1}AP\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)QBQ^{-1}. \]将\(P^{-1}AP, QBQ^{-1}\)写成分块矩阵的形式
\[P^{-1}AP=\begin{pmatrix} A_{11}&A_{12}\\ A_{21}&A_{22}\end{pmatrix}, QBQ^{-1}=\begin{pmatrix} B_{11}&B_{12}\\ B_{21}&B_{22}\end{pmatrix} \]故
\[\left(\begin{array}{cc} A_{11}&O\\ A_{21}&O\end{array}\right) =\left(\begin{array}{cc} B_{11}&B_{12}\\ O&O\end{array}\right). \]由此得\(A_{11}=B_{11}, A_{21}=O, B_{12}=O\).
所以
所以\(A,B\)的特征多项式分别为
\[f_A(\lambda)=|\lambda E_r-A_{11}|\cdot |\lambda E-A_{22}|,\quad f_B(\lambda)=|\lambda E_r-A_{11}|\cdot |\lambda E-B_{22}|. \]它们有公因式\(|\lambda E_r-A_{11}|\), 因而\(A\) 与\(B\)至少有\(r\) 个公共特征值(重根按重数计算).
例15 [Roth第一定理]
设\(A,B,C\)分别为\(m\times n\), \(n\times m\)与\(n\times n\) 矩阵, 则\(\r\left(\begin{array}{cc} A&O\\O&B\end{array}\right)
={\rm r}\left(\begin{array}{cc} A&O\\ C&B\end{array}\right)
\)的充要条件为存在矩阵\(X,Y\)使得
\(XA-BY=C\).
证明 \(\Longleftarrow\) 由\(\left(\begin{array}{cc} E&O\\ -X&E\end{array}\right) \left(\begin{array}{cc} A&O\\C&B\end{array}\right) \left(\begin{array}{cc} E&O\\ Y&E\end{array}\right) =\left(\begin{array}{cc} A&O\\O&B\end{array}\right) \)即得.
\(\Longrightarrow\) 设\(P_1AQ_1=\left(\begin{array}{cc} E_r&O\\O&O\end{array}\right)\stackrel{\Delta}{=}H_1,\; P_2BQ_2=\left(\begin{array}{cc} E_s&O\\O&O\end{array}\right)\stackrel{\Delta}{=}H_2.
\) 则
\begin{equation}
\left(\begin{array}{cc} P_1&O\O&P_2\end{array}\right)
\left(\begin{array}{cc} A&O\O&B\end{array}\right)
\left(\begin{array}{cc} Q_1&O\O&Q_2\end{array}\right)
=\left(\begin{array}{cccc} E_r&&&\ &O&&\ &&E_s&\ &&&O\end{array}\right),
\end{equation}
\begin{equation}
\begin{array}{ll}
&\left(\begin{array}{cc} P_1&O\O&P_2\end{array}\right)
\left(\begin{array}{cc} A&O\ C&B\end{array}\right)
\left(\begin{array}{cc} Q_1&O\O&Q_2\end{array}\right)
=\left(\begin{array}{cc} P_1AQ_1&O\ P_2CQ_1&P_2BQ_2\end{array}\right)\
=&
\left(\begin{array}{cccc} E_r&O&&\ O&O&&\ D_1&D_2&E_s&O\ D_3&D_4&O&O\end{array}\right)
=\left(\begin{array}{cc} H_1&O\ D&H_2\end{array}\right).
\end{array}
\end{equation}
从(2.5)中消去\(D_1\), 即
此过程可简记为
\[\left(\begin{array}{cc} -D_1&O\\ O&O\end{array}\right) \left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)+ \left(\begin{array}{cc} D_1&D_2\\ D_3&D_4\end{array}\right) = \left(\begin{array}{cc} O&D_2\\ D_3&D_4\end{array}\right). \]继续消去\(D_3,D_2\)的过程可简记为
\[\left(\begin{array}{cc} O&O\\ -D_3&O\end{array}\right) \left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)+ \left(\begin{array}{cc} O&D_2\\ D_3&D_4\end{array}\right) = \left(\begin{array}{cc} O&D_2\\ O&D_4\end{array}\right). \]\[\left(\begin{array}{cc} E_s&O\\ O&O\end{array}\right)\left(\begin{array}{cc} O&-D_2\\ O&O\end{array}\right)+ \left(\begin{array}{cc} O&D_2\\ O&D_4\end{array}\right) = \left(\begin{array}{cc} O&O\\ O&D_4\end{array}\right). \]由题设, (2.4)与(2.5)式右端的秩相等, 所以\(D_4=O\). 从而该消去过程相当于存在矩阵\(U=\left(\begin{array}{cc} O&O\\ -D_3&O\end{array}\right)+\left(\begin{array}{cc} -D_1&O\\ O&O\end{array}\right),V=\left(\begin{array}{cc} O&-D_2\\ O&O\end{array}\right)\)使得
\[UH_1+H_2V+D=O. \]即
\[U(P_1AQ_1)+(P_2BQ_2)V=-P_2CQ_1, \]或等价地,
\[(-P_2^{-1}UP_1)A-B(Q_2VQ_1^{-1})=C. \]令\(X=-P_2^{-1}UP_1\), \(Y=Q_2VQ_1^{-1}\), 即证.
例16 设\(A,B\)分别为\(m\times n\)与\(n\times m\)矩阵, 则\({\rm r}(A)+{\rm r}(B)={\rm r}(AB)+n\) 的充要条件为存在矩阵\(X,Y\)使得
\(XA-BY=E_n\).
证明 由Sylvester不等式的证明过程知只需证明
\[{\rm r}\left(\begin{array}{cc} A&O\\O&B\end{array}\right) ={\rm r}\left(\begin{array}{cc} A&O\\ E&B\end{array}\right) \Longleftrightarrow \exists X,Y, \mbox{s.t.} XA-BY=E_n. \]这由上题即得.
\(\S3\) 通过构造分块矩阵,再利用广义初等变换将其化为分块上(下)三角矩阵是解决行列式等式的常用方法.
例17 设\(A\,,\,B\,,\,C\,,\,D\)是\(n\)阶方阵, \(|A|\ne 0\). 证明
(1) 若\(AC=CA\),\ 则
\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|AD-CB|\,;\)
(2) 若 \(AB=BA\),\ 则
\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|DA-CB|\,.\)
证明 (1),若\(A\)可逆, 则
\begin{eqnarray}\begin{pmatrix}E&O\-A^{-1}C&E\end{pmatrix}\begin{pmatrix}A&B\C&D\end{pmatrix}&=&\begin{pmatrix}A&B\
-A{-1}CA+C&-ACB+D\end{pmatrix}$$12pt]
&\begin{tabular}{c}
\(\mbox{\scriptsize{AC=CA}}\)\
\hline\hline
\end{tabular}&\begin{pmatrix}A&B\O&-A^{-1}CB+D\end{pmatrix},,\end{eqnarray}
故$$\begin{vmatrix}A&B\C&D\end{vmatrix}=|A||-A^{-1}CB+D|=|AD-CB|,.$$
(2) 类似可证.
例18 [中国科学院大学2010]
设\(A, B\)分别是\(n\times m\)与\(m\times n\) 矩阵. 证明
证明 一方面,
\[\begin{pmatrix}E&O\\-A&E\end{pmatrix} \begin{pmatrix}E_m&B\\A&E_n\end{pmatrix} = \begin{pmatrix}E_m&B\\ O&E_n-AB\end{pmatrix} \]故$$\begin{vmatrix}E_m&B\ A&E_n\end{vmatrix}
=|E_m||E_n-AB|=|E_n-AB|,.$$
另一方面,
故$$\begin{vmatrix}E_m&B\ A&E_n\end{vmatrix}
=|E_m-BA||E_n|=|E_m-BA|,.$$
所以
注 [上海交通大学2005]
设\(A,B\)为\(n\)阶方阵,满足
\({\rm r}(E-AB)+{\rm r}(E+BA)=n\). 求证:\({\rm r}(A)=n\).
(提示: 先证\({\rm r}(E+BA)={\rm r}(E+AB)\), 从而\({\rm r}(E-AB)+{\rm r}(E+AB)=n\), 故\((AB)^2=E\), \(A\)可逆从而\({\rm r}(A)=n\), 参见\ref{Rank-AB-BA})
\end{remark}
下面的例子称为特征多项式的降阶公式.
例19 [上海大学2012]
设\(A, B\)分别是\(n\times m\)与\(m\times n\) 矩阵, \(\lambda\ne 0\). 证明
*证明 一方面,
\[\begin{pmatrix}E_n&O\\-\lambda^{-1} A&E\end{pmatrix} \begin{pmatrix}\lambda E_m&B\\ A& E_n\end{pmatrix} = \begin{pmatrix}\lambda E_m&B\\ O&E_n-\lambda^{-1} AB\end{pmatrix} \]故$$\begin{vmatrix}\lambda E_m&B\ A&E_n\end{vmatrix}
=|\lambda E_m||E_n-\lambda{-1}AB|=\lambda |\lambda E_n-AB|,.$$
另一方面,
故$$\begin{vmatrix}\lambda E_m&B\ A&E_n\end{vmatrix}
=|\lambda E_m-BA||E_n|=|\lambda E_m-BA|,.$$
所以