线性代数第五章
\(\S 1\) 向量的内积、长度及正交性
定义 1 内积
\[(x, y) = \sum x_i \cdot y_i \]定义 2 长度(范数)
\[|| x || = \sqrt{(x, x)} \]定理 1 若 \(n\) 维向量 \(a_1,a_2,\cdots ,a_n\) 是一组两两正交的非零向量,则 \(a_1,a_2,\cdots ,a_n\) 线性无关。
证:
设有 \(\lambda_1, \lambda_2 \cdots, \lambda_r\),使:
\[\sum_{i=1}^r \lambda_i a_i = 0 \]用 \(a_1\) 左乘上式
\[a_1 \sum_{i=1}^r \lambda_i a_i = 0 \\ a_1 \lambda_1a_1 + \sum_{i=2}^r \lambda_i a_i = 0 \\ \lambda_1 a_1^2 = 0 \]因为 \(a_1 \not = 0\),故 \(\lambda_1 = 0\),同理,\(\lambda\) 均为 \(0\),故得证。
定义 3 标准正交基
\(\xi_1, \xi_2, \cdots, \xi_r\) 是向量空间 \(V(V ⊆ \R^n)\) 的一个基,若 \(\xi_1, \xi_2, \cdots, \xi_r\) 两两正交,且都是单位向量,则称 \(\xi_1, \xi_2, \cdots, \xi_r\) 是 \(V\) 的一个标准正交基。
施密特(Schmidt)正交化
\[b_1 = a_1 \\ b_2 = a_2 - \frac{(a_2, b_1)}{(b_1, b_1)} b_1 \\ \cdots \\ b_r = a_r - \frac{(a_r, b_1)}{(b_1, b_1)} b_1 - \frac{(a_r, b_2)}{(b_2, b_2)} b_2 - \cdots - \frac{(a_r, b_{r-1})}{(b_{r-1}, b_{r-1})} b_{r-1} \\ \xi_1 = \frac{1}{||b_1||} b_1 \\ \xi_2 = \frac{1}{||b_2||} b_2 \\ \cdots \\ \xi_r = \frac{1}{||b_r||} b_r \]定义 4 正交矩阵
如果 \(n\) 阶矩阵 \(A\) 满足
\[A^T A = E \]则称 \(A\) 为正交矩阵。
易知,\(n\) 阶矩阵 \(A\) 为正交矩阵的充要条件为 \(A\) 的列向量均为单位向量,且两两正交。
定义 5 正交变换
若 \(P\) 为正交矩阵,则线性变换 \(y = Px\) 称作正交变换。
\[|| y || = \sqrt{y^T y} = \sqrt{x^TP^TPx} = \sqrt{x^Tx} = || x || \]即 经过正交变换的向量长度保持不变。
\(\S 2\) 方阵的特征值与特征向量
定义 6 特征值 / 特征向量
设 \(A\) 是 \(n\) 阶矩阵,如果数 \(\lambda\) 和 \(n\) 维非零列向量 \(x\) 使关系式:
\[Ax = \lambda x \]则称数 \(\lambda\) 为特征值,非零向量 \(x\) 称作 \(A\) 的对应于特征值 \(\lambda\) 的特征向量。
\[Ax = \lambda x \Rightarrow (A - \lambda E) x = 0 \]易知,\(|A - \lambda E| = 0\),解方程即可。
易知,在复数范围内,有 \(n\) 个解,即 \(n\) 个特征值 \(\lambda_1, \lambda_2, \cdots, \lambda_n\),有:
\[\sum_{i=1}^n \lambda_i = \sum_i^n a_{i, i} =\operatorname{tr}(A) \\ \prod_{i=1}^n \lambda_i =|A| \]求特征向量即解:
\[(A - \lambda_i E)x = 0 \]矩阵多项式对应的特征值
设 \(\lambda\) 是方阵 \(A\) 的特征值,那么 \(\lambda^{-1}\) 是 \(A^{-1}\) 的特征值。
证明如下:
\[Ap = \lambda p \\ (Ap)^{-1}=\lambda^{-1}p^{-1} \\ p^{-1} A^{-1}=\lambda^{-1}p^{-1} \\ A^{-1} p=\lambda^{-1}p \\ \]同理 \(\lambda^k\) 是 \(A^k\) 的特征值。
故 \(\varphi(\lambda)\) 是 \(\varphi(A)\) 的特征值(\(\varphi(\lambda) = a_0 + a_1 \lambda + \cdots + a_m \lambda^m\) 是 \(\lambda\) 的多项式,\(\varphi(A) = a_0E + a_1 A + \cdots + a_m A^m\) 是矩阵 \(A\) 的多项式)。
定理 2
设 \(\lambda_1, \lambda_2,\cdots ,\lambda_m\) 是方阵 \(A\) 的 \(m\) 个特征值,\(p_1, p_2, \cdots, p_m\) 依次是与之对应的特征向量,如果 \(\lambda_1, \lambda_2,\cdots ,\lambda_m\) 各不相等,则 \(p_1, p_2, \cdots, p_m\) 线性无关。
只要特征值不同,各自对应的特征向量之间一定线性无关。
\(\S 3\) 相似矩阵
定义 7 相似矩阵、相似变化、相似变化矩阵
设 \(A, B\) 都是 \(n\) 阶矩阵,若有可逆矩阵 \(P\),使:
\[P^{-1}AP = B \]则称 \(B\) 是 \(A\) 的相似矩阵,或说矩阵 \(A\) 与 \(B\) 相似。对 \(A\) 进行运算 \(P^{-1}AP\) 称为对 \(A\) 进行相似变换,可逆矩阵 \(P\) 称为把 \(A\) 变成 \(B\) 的相似变换矩阵。
证:
\[|B-\lambda E | = |P^{-1}AP - P^{-1}(\lambda E)P| = |P^{-1} (A-\lambda E) P| = |P^{-1}| |A - \lambda E| | P| = |A - \lambda E| \]若 \(B\) 为对角矩阵,则 \(B\) 的元素为 \(A\) 的特征值。
对角矩阵非常有意义!
\[A = PBP^{-1} \\ A^k = PB^kP^{-1} \\ \varphi(A) = P\varphi(B)P^{-1} \]将上式对应到对角矩阵 \(B = \Lambda\) 所对应的 \(B^k, \varphi(B)\) 均很好计算。故计算 \(A\) 的多项式可先将其对角化。
定理 4
\(n\) 阶矩阵 \(A\) 与对角矩阵相似(即 \(A\) 可对角化)的充分必要条件是 \(A\) 有 \(n\) 个线性无关的特征向量。
推论
如果 \(n\) 阶矩阵 \(A\) 的几个特征值互不相等,则 \(A\) 与对角矩阵相似。
\(\S 4\) 对称矩阵的对角化
性质 1 对称矩阵的特征值为实数
证:
\[A = \overline{A} \\ A \overline{x} = \overline {A} \overline {x} = \overline{Ax} = \overline{\lambda x} = \overline {\lambda} \overline {x} \\ \overline {x}^T A x = \overline {x}^T(Ax) = \overline {x}^T \lambda x = \lambda \overline {x}^T x \\ \overline {x}^T A x = (\overline {x}^TA^T)x = (A\overline{x})^Tx = (\overline {\lambda} \overline {x})^Tx = \overline {\lambda} \overline {x}^Tx \\ \lambda \overline {x}^T x - \overline {\lambda} \overline {x}^Tx = 0 \\ (\lambda - \overline {\lambda }){x}^T x = 0 \\ \lambda = \overline \lambda \]性质 2 不同特征值对应的特征向量正交
证:
\[\lambda_1 p_1 = Ap_1 \\ \lambda_2 p_2 = Ap_2 \\ \lambda_1 \not= \lambda_2 \\ ------ \\ \lambda_1p_1^T = (\lambda_1p_1)^T = (Ap_1)^T = p_1^TA \\ \lambda_1p_1^Tp_2 = p_1^TAp_2 = p_1^T \lambda_2p_2=\lambda_2p_1^Tp_2 \\ (\lambda_1-\lambda_2)p_1^Tp_2 = 0 \\ p_1^Tp_2 = 0 \]定理 5
设 \(A\) 为 \(n\) 阶对称矩阵,则必有正交矩阵 \(P\),使 \(P^{-1}AP = P^TAP=\Lambda\),其中 \(\Lambda\) 是以 \(A\) 的 \(n\) 个特征值为对角元的对角矩阵。
性质 3 设 \(A\) 为 \(n\) 阶对称矩阵,\(\lambda\) 是 \(A\) 的特征方程的 \(k\) 重根,则矩阵 \(A-\lambda E\) 的秩 \(R(A- \lambda E)=n-k\),从而对应特征值 \(\lambda\) 恰有 \(k\) 个线性无关的特征向量
\(A-\lambda E\) 也为对称矩阵,由定理 5,\(A - \lambda E\) 与 \(\Lambda' = \operatorname{diag}(\lambda_1-\lambda, \lambda_2 - \lambda, \cdots, \lambda_n-\lambda)\) 相似,且后矩阵中有 \(k\) 个零项,\(n-k\) 个非零项,因此:
\[R(A-\lambda E) = R(\Lambda') = n - k \]对称矩阵对角化的步骤
1)求特征值;
2)对于重数为 \(k\) 的特征值,求解方程 \((A - \lambda) x = 0\) 的基础解系,得到 \(k\) 个线性无关的特征向量。再把他们正交化、单位化,得 \(k\) 个两两正交的单位特征向量;
3)将上述得到的 \(n\) 个单位特征向量构成正交矩阵 \(P\),便有 \(P^{-1}AP = P^TAP = \Lambda\),其中特征向量的位置与特征值的放置要一一对应。
\(\S 5\) 二次型及其标准形
定义 8 二次型、标准二次型(标准形)、规范二次型(规范形)
含有 \(n\) 个变量 \(x_1, x_2, \cdots, x_n\) 的二次齐次函数
\[f(x_1, x_2, \cdots, x_n) = \sum_{i=1}^n a_{ii}x_i^2 + \sum_{i=1}^n\sum_{j=i+1}^n 2a_{ij}x_ix_j \]称为二次型。
当 \(j>i\) 时,取 \(a_{ji} = a_{ij}\),上式可写作:
\[f=\sum_{i=1}^n\sum_{j=1}^n a_{ij}x_ix_j \]当 \(a_{ij}\) 为复数,\(f\) 称为复二次型;当 \(a_{ij}\) 为师叔数,\(f\) 称为复二次型;
当 \(a_{ij} = 0(i \not=j)\) 时,称作标准二次型(简称标准形);当 \(a_{ij} = 0(i \not=j)\) 且 \(a_{ii} = -1 / 0 / 1\) 时,称作规范二次型(简称规范形)。
二次型可用矩阵记作:
\[f = x^T A x \]其中 \(A\) 为对称矩阵。
主要问题:对二次型,是否存在可逆的线性变换:
\[\left\{ \begin{matrix} x_1 = c_{11}y_1 + c_{12}y_2 + \cdots + c_{1n}y_n \\ x_2 = c_{21}y_1 + c_{22}y_2 + \cdots + c_{2n}y_n \\ \cdots \\ x_n = c_{n1}y_1 + c_{n2}y_2 + \cdots + c_{nn}y_n \\ \end{matrix} \right. \]使原二次型变成标准形。
记 \(C = (c_{ij})\),可逆变换可记作:\(x = Cy\),有:
\[f = x^TAx = y^TC^TACy = y^T(C^TAC)y \]定义 9 合同
设 \(A\) 和 \(B\) 是 \(n\) 阶矩阵,若有可逆矩阵 \(C\),使 \(B =C^TAC\),则称矩阵 \(A\) 与 \(B\) 合同。
为使原二次型变成标准形,即使 \((C^TAC)\) 为对角矩阵。
\(A\) 为对称矩阵,由上节定理 5 知,任给对称矩阵 \(A\),总有正交矩阵 \(P\),使 \(P^{-1}AP = \Lambda\),即 \(P^TAP=\Lambda\)。
定理 6
任给二次型 \(f=\sum_{i=1}^n\sum_{j=1}^n a_{ij}x_ix_j(a_{ij}=a_{ji})\),总有正交变换 \(x=Py\),使 \(f\) 化为标准型:
\[f = \sum_{i=1}^n \lambda_i y_i^2 \]其中 \(\lambda_1, \lambda_2, \cdots, \lambda_n\) 是 \(f\) 的矩阵 \(A\) 的特征值。
推论
任给 \(n\) 元二次型 \(f(x) = x^TAx \ (A^T=A)\),总有可逆变换 \(x=Cz\),使 \(f(Cz)\) 为规范形。
\(f\) 的秩为 \(r\),设 \(\lambda_1, \lambda_2, \cdots, \lambda_r\) 不等于 \(0\),\(\lambda_{r+1} = \lambda_{r+2} = \cdots \lambda_{n} = 0\),则如下构造能将 \(f(Cz)\) 变为规范形。
\[x = Py \\ y = Kz \\ K = \operatorname{diag}(k_1, k_2, \cdots, k_n) \\ k_i =\left\{ \begin{matrix} \frac{1}{\sqrt{|\lambda_i|}}, i \leq r \\ 1, \ i > r \end{matrix} \right. \]\(\S 6\) 用配方法化二次型成标准形
实操一次即可理解,提取含 \(x_1\) 的、含 \(x_2\) 的、\(\cdots\)。
\[f = x_1^2 + 2x_2^2 + 5x_3^2+2x_1x_2+2x_1x_3+6x_2x_3 \\ = (x_1 + x_2 + x_3)^2-x_2^2-x_3^2-2x_2x_3 + 2x_2^2 + 5x_3^2+6x_2x_3 \\ = (x_1 + x_2 + x_3)^2+ x_2^2 + 4x_3^2+4x_2x_3 \\ = (x_1 + x_2 + x_3)^2+ (x_2+2x_3)^2 \]\(\S 7\) 正定二次型
定理 7 惯性定理
设二次型 \(f=x^TAx\) 的秩为 \(r\),且有两个可逆变换:
\[x = Cy \\ x = Pz \]使:
\[f = \sum_{i=1}^r k_iy_i^2 \\ f = \sum_{i=1}^r \lambda_iz_i^2 \]则 \(k\) 中正数的个数与 \(\lambda\) 中正数的个数相等。
定义 10 正定、负定
设二次型 \(f(x) = x^TAx\),若对任何 \(x\not=0\),都有 \(f(x)>0\)(显然 \(f(0)=0\)),则称 \(f\) 为正定二次型,并称对称矩阵 \(A\) 是正定的;如果对任何 \(x\not=0\),都有 \(f(x)<0\),则称 \(f\) 为负定二次型,并称对称矩阵 \(A\) 是负定的。
定理 8
\(n\) 元二次型 \(f=x^TAx\) 为正定的充分必要条件是:它的标准形的 \(n\) 个系数全为正,即它的规范形的 \(n\) 个系数全为 \(1\),亦即他的正惯性指数等于 \(n\)。
充分性显然,必要性使用反证法,若存在 \(k_x \leq 0\),当取 \(y = e_s\) 时,\(f(Ce_s) = k_s \leq 0\),显然 \(Ce_s \not= 0\),故矛盾。
推论
对称矩阵 \(A\) 为正定的充分必要条件是:\(A\) 的特征值全为正。
定理 9 赫尔维茨定理
对称矩阵 \(A\) 为正定的充分必要条件是:\(A\) 的各阶顺序主子式都为正,即:
\[\left|\begin {array}{c} a_{11} \ a_{12} \ \cdots \ a_{1n} \\ a_{21} \ a_{22} \ \cdots \ a_{2n} \\ \vdots \ \ \ \ \ \ \vdots \ \ \ \ \ \ \ \ \ \ \ \ \ \vdots \\ a_{r1} \ a_{r2} \ \cdots \ a_{rn} \\ \end{array}\right| > 0(r = 1, 2, \cdots, n) \]对称矩阵 \(A\) 为负定的充分必要条件是:奇数阶顺序主子式为负,而偶数阶顺序主子式为正,即:
\[(-1)^r\left|\begin {array}{c} a_{11} \ a_{12} \ \cdots \ a_{1n} \\ a_{21} \ a_{22} \ \cdots \ a_{2n} \\ \vdots \ \ \ \ \ \ \vdots \ \ \ \ \ \ \ \ \ \ \ \ \ \vdots \\ a_{r1} \ a_{r2} \ \cdots \ a_{rn} \\ \end{array}\right| > 0(r = 1, 2, \cdots, n) \] 标签:特征值,二次,sum,矩阵,相似矩阵,overline,cdots,线性代数,lambda From: https://www.cnblogs.com/chzhc-/p/18600695