\(\symbfit{A}\symbfit{x}=\symbfit{b}\) 可解性与解的结构
在上一节说明了利用消元法求解\(\symbfit{A}\symbfit{x}=\symbfit{0}\),这一节在此基础上分析\(\symbfit{A}\symbfit{x}=\symbfit{b}\symbfit{A}\symbfit{x}=\symbfit{b}\),以及可解性与解的结构。
仍使用上一节的例子,假设\(\symbfit{A}=\begin{bmatrix}1&2&2&2\\2&4&6&8\\3&6&8&10\end{bmatrix}\)。
那么增广矩阵\(\begin{bmatrix}\symbfit{A}&\symbfit{b}\end{bmatrix}=\begin{bmatrix}1&2&2&2&b_1\\2&4&6&8&b_2\\3&6&8&10&b_3\end{bmatrix}\)
利用消元法,最终可以变换为:
\[\begin{bmatrix} 1& 2& 2& 2& b_1\\ 0& 0& 2& 4& b_2-2b_1\\ 0& 0& 0& 0& b_3-b_2-b_1\\ \end{bmatrix} \] 这样便得到了方程组有解的一个必要条件:\(b_3-b_2-b_1=0\)。(根据线性方程组和矩阵的联系不难得出)
如果假设\(\symbfit{b}=\begin{bmatrix}1 \\5 \\6\end{bmatrix}\),那么上述矩阵就变成:
\[\begin{bmatrix} 1& 2& 2& 2& 1\\ 0& 0& 2& 4& 3\\ 0& 0& 0& 0& 0\\ \end{bmatrix} \] 下面便对可解性与解的结构进行说明:
可解性(Solvability):
- \(\symbfit{A}\symbfit{x}=\symbfit{b}\)有解当且仅当\(\symbfit{b}\in\symbf{C}\left(\symbfit{A}\right)\)成立。(即\(\symbfit{b}\)必须是\(\symbfit{A}\)各列的线性组合);
- 如果\(\symbfit{A}\)各行的线性组合得到零行(一行的元素全是0),那么\(\symbfit{b}\)中元素的同样组合必然也是0。
这两条是等价的,即满足其中任意一条,则方程组有解。
下一个是求\(\symbfit{A}\symbfit{x}=\symbfit{b}\)的所有解(即解的结构):
- 只求一个特定的解,即特解\(\symbfit{x}_p\):将所有自由变量设为0,然后解出\(\symbfit{A}\symbfit{x}=\symbfit{b}\)中的主变量;
在上例中,\(x_2=0\),\(x_4=0\),解得\(x_1=-2\),\(x_3=3/2\),\(\symbfit{x}_p=\begin{bmatrix}-2 \\0 \\3/2\\ 0\end{bmatrix}\)。
- 加上零空间中的任意\(\symbfit{x}_n\);
- \(\symbfit{x} = \symbfit{x}_p + \symbfit{x}_n\)。
其正确性可以用矩阵乘法的(右)分配率简单证明:因为已知
\[\symbfit{A}\symbfit{x}_p=\symbfit{b} \\ \symbfit{A}\symbfit{x}_n=\symbfit{0} \\ \] 那么有:
\[\symbfit{A}\left(\symbfit{x}_p + \symbfit{x}_n\right)=\symbfit{b} \] 即,对于方程组某解,其与零空间内任意向量之和仍为解。而且第一步中求解出的特解\(\symbfit{x}_p\)并不在矩阵\(\symbfit{A}\)的零空间中(\(\symbfit{b}\neq\symbfit{0}\)),因此可以保证这是所有解。其次,也可以证明任取的特解(前提是\(\symbfit{b}\neq\symbfit{0}\)且特解不在\(\symbfit{A}\)的零空间中)与零空间向量的和包含了其他的特解:
假设有特解\(\symbfit{x}_1\)与\(\symbfit{x}_2\),那么有\(\symbfit{A}\symbfit{x}_1=\symbfit{b}\)和\(\symbfit{A}\symbfit{x}_2=\symbfit{b}\),即\(\symbfit{A}\left(\symbfit{x}_1 - \symbfit{x}_2\right)=\symbfit{0}\),那么就说明向量\(\left(\symbfit{x}_1 - \symbfit{x}_2\right)\)在\(\symbfit{A}\)的零空间中,那么\(\symbfit{x}_2\)就可以由\(\symbfit{x}_1\)与\(\left(\symbfit{x}_1 - \symbfit{x}_2\right)\)的线性组合得到。
在上例中,由于上一节已经解出\(x_n=c_1\begin{bmatrix}-2\\1\\0\\0\end{bmatrix}+c_2\begin{bmatrix}2\\0\\-2\\1\end{bmatrix}\),那么\(x = \symbfit{x_p}=\begin{bmatrix}-2 \\0 \\3/2\\ 0\end{bmatrix} + x_n=c_1\begin{bmatrix}-2\\1\\0\\0\end{bmatrix}+c_2\begin{bmatrix}2\\0\\-2\\1\end{bmatrix}\)。
这个在几何上可以理解为零空间(直线、平面等)沿着特解的方向与大小做了平移。
下面将\(\symbfit{A}\symbfit{x}=\symbfit{b}\)的解与\(r\left(\symbfit{A}\right)\)联系起来:
对于秩为\(r\)的\(m \times n\)大小的矩阵\(\symbfit{A}\)有\(r\leq m\)且\(r \leq n\)。首先考虑满秩(full rank)即\(r\)取最大的情况,又分为列满秩、行满秩和行列皆满秩三种情况,最后考虑不满秩的情况。
-
列满秩(\(r = n < m\)):
所有列都有主元,没有自由变量,\(N\left(\symbfit{A}\right) = \symbfit{0}\)(因为没有自由变量赋值,\(\symbfit{R}\symbfit{x}=\symbfit{0}\)只有零向量符合)。
此时\(\symbfit{A}\)消元后\(\symbfit{R}=\begin{bmatrix}\symbfit{I}\\\symbfit{0}\end{bmatrix}\)。
此时\(\symbfit{A}\symbfit{x}=\symbfit{b}\)的解:\(\symbfit{x} = \symbfit{x}_p\),该线性方程组有唯一解或无解(有无解得看其是否满足可解性)。
-
行满秩(\(r = m < n\)):
自由变量仍是\(n - r\)个。
此时\(\symbfit{A}\)消元后\(\symbfit{R}=\begin{bmatrix}\symbfit{I}&\symbfit{F}\end{bmatrix}\)。
此时无论\(\symbfit{b}\)取什么,\(\symbfit{A}\symbfit{x}=\symbfit{b}\)都有解,因为不存在零行的情况。此时\(\symbfit{A}\symbfit{x}=\symbfit{b}\)有无穷多解。
-
行列皆满秩(\(r = m = n\)):
此时\(\symbfit{A}\)消元后\(\symbfit{R}=\symbfit{I}\)。
结合行满秩和列满秩的结论,不难得出无论\(\symbfit{b}\)取什么,\(\symbfit{A}\symbfit{x}=\symbfit{b}\)都有解,且是唯一解。
-
不满秩(\(r < m\),\(r < n\)):
此时\(\symbfit{A}\)消元后\(\symbfit{R}=\begin{bmatrix}\symbfit{I}&\symbfit{F}\\\symbfit{0}&\symbfit{0}\end{bmatrix}\)。
此时\(\symbfit{A}\symbfit{x}=\symbfit{b}\)的解:无解(不满足可解性)或无穷多解(\(\symbfit{x} = \symbfit{x}_p + \symbfit{x}_n\))。