矩阵的秩用法实在过于灵活,写篇随笔记录一下。
矩阵的秩定义
矩阵的秩常见定义有以下两种:
- 非零子式的最高阶数。
- 行(列)向量空间的极大无关组向量个数。
矩阵的秩基本性质
从定义出发不难得到以下性质:
- \(0\le r(A)\le\min(m,n)\) 。
- \(r(A^T)=r(A)\) 。
- \(r(kA)=r(A)\) ,要求 \(k\neq 0\) 。
- \(r(A)=r(AA^T)=r(A^TA)\) 。
- 初等变换不改变矩阵的秩。
- \(r(A)\) 等于 \(A\) 的标准型中 \(1\) 的个数。
- 若 \(P,Q\) 可逆,则 \(r(A)=r(PA)=r(AQ)=r(PAQ)\) 。
第 4 条性质的证明:
为证 \(r(A)=r(A^TA)\) ,只需证 \(Ax=0\) 和 \(A^TAx=0\) 是同解方程组。
若 \(Ax=0\) ,左乘 \(A^T\) 可知 \(A^TAx=0\) 。
若 \(A^TAx=0\) ,左乘 \(x^T\) 可知 \((Ax)^TAx=0\) 。
设 \(Ax=(a_1,\cdots,a_n)^T\) ,则 \((Ax)^TAx=\sum_{i=1}^na_i^2=0\) 。因此 \(a_i=0\) ,即 \(Ax=0\) 。
再用 \(A^T\) 替换 \(A\) 可知 \(r(AA^T)=r(A)\) 。
矩阵的秩其他性质
性质1、设 \(A_{m\times n},B_{n\times s}\) ,则 \(r(A)+r(B)-n\le r(AB)\le\min(r(A),r(B))\) 。
推论:特别地,若 \(AB=0\) ,则 \(r(A)+r(B)\le n\) 。
证明:
记 \(A\) 的列向量为 \(\alpha_1,\cdots,\alpha_n\) ,则:
\[AB=\begin{pmatrix}b_{11}\alpha_1+\cdots+b_{n1}\alpha_n&\cdots&b_{1s}\alpha_1+\cdots+b_{ns}\alpha_n\\\end{pmatrix} \]\(\therefore AB\) 的列空间包含在 \(A\) 的列空间中,即 \(r(AB)\le r(A)\) 。同理 \(AB\) 的行空间包含在 \(B\) 的行空间中, \(r(AB)\le r(B)\) 。
前半部分等给出分块矩阵的秩的性质以后再证。
性质2、\(r\begin{pmatrix}A&0\\0&B\\\end{pmatrix}=r(A)+r(B)\) 。
证明:
设 \(P_1AQ_1=\begin{pmatrix}I_{r_1}&0\\0&0\\\end{pmatrix},P_2BQ_2=\begin{pmatrix}I_{r_2}&0\\0&0\\\end{pmatrix}\),其中 \(P_1,P_2,Q_1,Q_2\) 均为初等矩阵乘积。(本质上就是将 \(A,B\) 化为标准型)
\[\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix} \times \begin{pmatrix}A&0\\0&B\\\end{pmatrix} \times \begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix} = \begin{pmatrix}P_1AQ_1&0\\0&P_2BQ_2\\\end{pmatrix}\\ \]\(\because\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix},\begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix}\) 满秩, \(\therefore r\begin{pmatrix}A&0\\0&B\\\end{pmatrix}=r_1+r_2=r(A)+r(B)\) 。
性质3、\(r\begin{pmatrix}A&C\\0&B\\\end{pmatrix}\ge r(A)+r(B),r\begin{pmatrix}A&0\\D&B\\\end{pmatrix}\ge r(A)+r(B)\) 。
证明:
设 \(P_1AQ_1=\begin{pmatrix}I_{r_1}&0\\0&0\\\end{pmatrix},P_2BQ_2=\begin{pmatrix}I_{r_2}&0\\0&0\\\end{pmatrix}\),其中 \(P_1,P_2,Q_1,Q_2\) 均为初等矩阵乘积。
\[\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix} \times \begin{pmatrix}A&0\\0&B\\\end{pmatrix} \times \begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix} = \begin{pmatrix}P_1AQ_1&P_1CQ_2\\0&P_2BQ_2\\\end{pmatrix}\\ \]\(\because\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix},\begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix}\) 满秩, \(\therefore r\begin{pmatrix}A&C\\0&B\\\end{pmatrix}\ge r_1+r_2=r(A)+r(B)\) ,后半部分同理。
性质4、 \(\max(r(A),r(B))\le r(A,B)\le r(A)+r(B)\) 。
证明:
记 \((A,B),A,B\) 的列向量空间分别为 \(W,W_1,W_2\) ,则 \(W_1\subseteq W,W_2\subseteq W\) ,左半部分得证。
\(W\subseteq W_1+W_2\) ,右半部分得证。
性质5、\(|r(A)-r(B)|\le r(A\pm B)\le r(A)+r(B)\) 。
记 \((A+B),A,B\) 的列向量空间分别为 \(W,W_1,W_2\) ,则 \(W\subseteq W_1+W_2\) ,右半部分得证。
套用右半部分结论即可证明左半部分。
现在来证明性质1的左半部分(即 \(\texttt{Sylvester}\) 不等式)。
\[\begin{pmatrix}AB&0\\0&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}AB&0\\B&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}0&-A\\B&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}-A&0\\I_n&B\\\end{pmatrix} \]\[\therefore r(AB)+n=r\begin{pmatrix}AB&0\\0&I_n\\\end{pmatrix}=r\begin{pmatrix}-A&0\\I_n&B\\\end{pmatrix}\ge r(A)+r(B)\\ \]\[\begin{pmatrix}ABC&0\\0&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}ABC&0\\AB&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}0&-BC\\AB&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}-BC&0\\B&AB\\\end{pmatrix} \]\[\therefore r(ABC)+r(B)\ge r(AB)+r(BC)\\ \]性质6、(\(\texttt{Frobenius}\) 不等式) \(r(ABC)\ge r(AB)+r(BC)-r(B)\) 。
和 \(\texttt{Sylvester}\) 不等式的证明过程如出一辙。
\[\begin{pmatrix}A&0\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\A&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}A-A^2&A\\A&I_n\\\end{pmatrix} \]性质7、 \(r(A)+r(I_n-A)\ge n\) ,当且仅当 \(A\) 是幂等矩阵(\(A^2=A\))时等号成立。
\(\therefore r(A)+r(I_n-A)=r(A-A^2)+n\) ,得证。
\[\begin{pmatrix}I_n+A&0\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}I_n+A&I_n+A\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}I_n+A&I_n+A\\I_n+A&2I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}(I_n+A)-\frac 12(I_n+A)^2&I_n+A\\0&2I_n\\\end{pmatrix} \]性质8、 \(r(I_n+A)+r(I_n-A)\ge n\) ,当且仅当 \(A\) 是对合矩阵(\(A^2=I_n\))时等号成立。
\(\because (I_n+A)-\frac 12(I_n+A)^2=\frac 12(I_n-A^2)\) , \(\therefore r(I_n+A)+r(I_n-A)=r(I_n-A^2)+n\) ,得证。
性质9、\(r(A^{n+m})=r(A^n)\) ,若 \(A\) 是幂零矩阵(\(\exist m,A^m=0\)),则 \(A^n=0\) 。
由性质1, \(n\ge r(A)\ge r(A^2)\ge\cdots\ge 0\) 。
我们证明 \(r(A^s)=r(A^{s+1})\Rightarrow r(A^{s+1})=r(A^{s+2})\) 。
事实上,在性质6中令 \(B=A^s,C=A\) 即可得证。
从 \(n\) 到 \(0\) 至多减 \(n\) 次,因此从 \(n\) 次幂开始矩阵幂的秩一定不再变化。
对幂零矩阵 \(A\) ,若 \(m\le n\) ,两边同乘 \(A^{m-n}\) ;若 \(m\gt n\) ,利用刚刚证明的结论,即可证明 \(A^n=0\) 。
性质10、\(r(A^*)=\begin{cases}n&r(A)=n\\1&r(A)=n-1\\0&r(A)\le n-2\\\end{cases}\) 。
若 \(r(A)=n\) ,则 \(|A^*|=|A|^{n-1}\neq 0\) , \(|A^*|\) 满秩。
若 \(r(A)=n-1\) ,则 \(A\) 一定存在一个 \(n-1\) 阶子式非零,因此 \(r(A^*)\ge 1\) 。
又 \(AA^*=0\) ,由性质1推论知 \(r(A)+r(A^*)\le n\) ,即 \(r(A^*)\le 1\) ,得证。
若 \(r(A)\le n-2\) ,则任意一个 \(n-1\) 阶子式均为零, \(A^*=0\) 。
杂题
\(n\) 为奇数, \(AB=0\) ,则 \(r(A^TB+AB^T)\le n-1\) 。
由性质1推论, \(r(A)+r(B)\le n\) 。由 \(n\) 为奇数,不妨 \(r(A)\le\frac{n-1}2\) 。
\(\therefore r(A^TB+AB^T)\le r(A^TB)+r(AB^T)\le r(A^T)+r(A)\le n-1\) 。
\(r(I_n-AB)\le r(I_n-A)+r(I_n-B)\) 。
\(r(I_n-AB)\le r(I_n-A)+r(A(I_n-B))\le r(I_n-A)+r(I_n-B)\) 。
\[\begin{pmatrix}A&0\\0&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\0&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\A&A+B\\\end{pmatrix} \]\[\begin{pmatrix}A&A\\A&A+B\\\end{pmatrix} \times \begin{pmatrix}A+B&0\\-A&I_n\\\end{pmatrix} = \begin{pmatrix}AB&A\\AB-BA&A+B\\\end{pmatrix} \]\[\therefore r(A)+r(B)=r\begin{pmatrix}A&A\\A&A+B\\\end{pmatrix}\ge r\begin{pmatrix}AB&A\\0&A+B\\\end{pmatrix}\ge r(A+B)+r(AB) \]若 \(AB=BA\) ,则 \(r(A+B)+r(AB)\le r(A)+r(B)\) 。
怎么想到的?单纯的初等变换能得到 \(A+B\) ,但没办法在保护 \(A+B\) 的前提下得到 \(AB\) ,于是想到矩阵乘法。
为使矩阵乘法后右下角仍为 \(A+B\) ,容易想到右乘矩阵 \(\begin{pmatrix}X&0\\Y&I_n\\\end{pmatrix}\) 。
\[\begin{pmatrix}A&A\\A&A+B\\\end{pmatrix} \times \begin{pmatrix}X&0\\Y&I_n\\\end{pmatrix} = \begin{pmatrix}A(X+Y)&A\\A(X+Y)+BY&A+B\\\end{pmatrix} \]令 \(\begin{cases}A(X+Y)=B\\A(X+Y)+BY=0\end{cases}\) ,结合 \(AB=BA\) 即可解出 \(X=A+B,Y=-A\) 。
如果选择左乘矩阵 \(\begin{pmatrix}X&Y\\0&I_n\\\end{pmatrix}\) 也行得通,读者可以自行思考。
\[\begin{aligned} &r(I_n-A)\\ &=r\big((I_n-B_1)+B_1(I_n-B_2)+\cdots+B_1\cdots B_{k-1}(I_n-B_k)\big)\\ &\le r(I_n-B_1)+r(B_1(I_n-B_2))+\cdots+r(B_1\cdots B_{k-1}(I_n-B_k))\\ &\le r(I_n-B_1)+r(I_n-B_2)+\cdots+r(I_n-B_k)\\ \end{aligned} \]\(\forall 1\le i\le k\) ,\(B_i\) 是幂等矩阵, \(A=B_1\cdots B_k\) ,则 \(r(I_n-A)\le k(n-r(A))\) 。
由性质7, \(r(I_n-B_i)\le n-r(B_i)\le n-r(A)\) ,得证。
总结
- 第三类分块初等变换:将某块行左乘 \(B\) 加到另一块行,矩阵的秩不变;将某块列右乘 \(B\) 加到另一块列,矩阵的秩不变。
- 证明与秩有关的等式或不等式,往往先移项使两边全是加法,常数项当成单位阵的秩,然后拼成分块对角矩阵。
- 分块初等变换本质上是对秩进行恒等变形,矩阵乘法本质上是对秩进行放缩。