0.前言
线性代数是数学的一个分支,线性代数的研究对象是向量、向量空间(又称线性空间),线性变换和有限维的线性方程组。即线性代数主要处理线性关系问题,线性关系即数学对象之间的关系是以一次形式来表达的。
线性(Linear)是指量与量之间按比例、成直线的关系,在数学上可以理解为一阶导数为常数的函数。
根据同济大学数学系编著的《线性代数》教材,将知识点按行列式、矩阵、向量组的线性相关性、相似矩阵及二次型、线性空间与线性变换五部分进行归纳总结。
1.行列式
1.1 定义
矩阵的行列式,determinate(简称det),是基于该矩阵的行列数据所计算的一个标量,n阶行列式的几何意义是以n个向量为邻边的n维图形的体积。
注意:行列式的行数=列数,行列式引入求解线性方程组(后面将提到)
1.2 性质
- 性质1:行列互换,其值不变
即行列式与它的转置行列式的值相等, ∣ A ∣ = ∣ A T ∣ |A|=|A^T| ∣A∣=∣AT∣ - 性质2:行列式某行(列)的元素全为0,行列式的值为0。
几何上可以理解为该n阶行列式的值等于n维图形的体积,现在有一个维度(向量)长度为0,则该图形这个维度上体积为0。
放在定义式中,累加的每一项都是0,因为累加的每一项是取自不同行不同列的n个元素乘积。 - 性质3:行列式的某两行(列)元素相等或对应成比例,则行列式为零
几何上理解为组成n维图形的n个向量中,有两向量(边)在同一直线上,故在该图形这个维度上体积为0。
在定义式中,成比例的项可以提出公因式,提出公因式后奇排列和偶排列的项会一一抵消(可以列一个简单的3阶行列式进行感受) - 性质4:某行(列)所有的元素都是两个数的和,则可将其拆成两个行列式之和
如: ∣ a 1 + b 1 a 2 + b 2 a 3 + b 3 c 1 c 2 c 3 d 1 d 2 d 3 ∣ = ∣ a 1 a 2 a 3 c 1 c 2 c 3 d 1 d 2 d 3 ∣ + ∣ b 1 b 2 b 3 c 1 c 2 c 3 d 1 d 2 d 3 ∣ \left|\begin {array}{c} a_1+b_1 &a_2+b_2 &a_3+b_3 \\ c_1 &c_2 &c_3 \\ d_1 &d_2 &d_3 \\ \end{array}\right|=\left|\begin{array}{c} a_1 &a_2 &a_3 \\ c_1 &c_2 &c_3 \\ d_1 &d_2 &d_3\\ \end{array}\right|+\left|\begin{array}{c} b_1 &b_2 &b_3 \\ c_1 &c_2 &c_3 \\ d_1 &d_2 &d_3\\ \end{array}\right| a1+b1c1d1a2+b2c2d2a3+b3c3d3 = a1c1d1a2c2d2a3c3d3 + b1c1d1b2c2d2b3c3d3
理解这件事情需要从定义式入手
定义式是多项的累加,而每项都包含不同行列的元素之积,这里的可拆其实就是定义式中进行乘法分配律。
注意:行列式拆是只拆某行(列),而矩阵A+B相加指的是所有元素相加。 - 性质5:两行(列)互换,行列式的值反号
反号是因为奇偶排列发生了改变,要理解这一点从定义中行列式的定义式入手, j 1 j 2 . . . j n j_1j_2...j_n j1j2...jn是排列,当为偶排列时带正号,为奇排列时带负号,行列式行(列)互换,奇偶排列改变,行列式的值反号。 - 性质6:某行(列)元素有公因子
k
(
k
≠
0
)
k(k\neq0)
k(k=0),则
k
k
k可提到行列式外面
要理解性质6需要和性质5一样从行列式的定义式入手,某行(列)的元素都有公因子,代表定义式中累加的每一项都有公因子,那么相当于将每一项的这个公因子k提取到外面。
注意:行列式只是某行(列)公因子提到外面,而矩阵是每一个元素的公因子提到外面。 - 性质7:某行(列)的k倍加到另一行(列),行列式的值不变
从定义式入手,结合定理4,可以将其“乘法分配律”,之后拆成原来的行列式与被加那行(列)替换为k倍加的那行的行列式相加,再根据性质3的理解,知道被加那行(列)替换为k倍加的那行的行列式为0。
1.3 行列式展开定理(公式)
1.3.1 余子式与代数余子式
-
定义:在n阶行列式中,划去元素 a i j a_{ij} aij所在的 i i i行与 j j j列的元,剩下的元不改变原来的顺序所构成的n-1阶行列式称为元素 a i j a_{ij} aij的余子式。数学表示上记作 M i j M_{ij} Mij
如: ∣ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ \left|\begin{array}{c} a_{11} &a_{12} &a_{13} \\ a_{21} &a_{22} &a_{23} \\ a_{31} &a_{32} &a_{33}\\ \end{array}\right| a11a21a31a12a22a32a13a23a33 中, a 22 a_{22} a22的余子式 M 22 = ∣ a 11 a 13 a 31 a 33 ∣ M_{22}=\left|\begin{array}{c} a_{11} &a_{13} \\ a_{31} &a_{33} \\ \end{array}\right| M22= a11a31a13a33 -
而根据 M i j M_{ij} Mij定义代数余子式 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij
则在上面行列式中 A 22 = ( − 1 ) 2 + 2 M 22 = ∣ a 11 a 13 a 31 a 33 ∣ A_{22}=(-1)^{2+2}M_{22}=\left|\begin{array}{c} a_{11} &a_{13} \\ a_{31} &a_{33} \\ \end{array}\right| A22=(−1)2+2M22= a11a31a13a33 -
引理:一个n阶行列式,如果其中第 i i i行所有元素除 ( i , j ) (i,j) (i,j)元 a i j a_{ij} aij外都为零,那么这行列式等于 a i j a_{ij} aij与它的代数余子式的乘积,即 D = a i j A i j D=a_{ij}A_{ij} D=aijAij
这一引理可以根据行列式的计算式推导(将i行和j列包含的含0项全部划掉,仅剩含 a i j a_{ij} aij的项,提出 a i j a_{ij} aij后剩下的为代数余子式)。
1.3.2 行列式按行(列)展开法则
- 定义:行列式等于它的任一行(列)的各元素与其对应的代数余子式乘积之和,即
D
=
a
i
1
A
i
1
+
a
i
2
A
i
2
+
.
.
.
+
a
i
n
A
i
n
(
i
=
1
,
2
,
.
.
.
,
n
)
D=a_{i1}A_{i1}+a_{i2}A_{i2}+...+a_{in}A_{in}\ \ \ (i=1,2,...,n)
D=ai1Ai1+ai2Ai2+...+ainAin (i=1,2,...,n)或
D
=
a
1
j
A
1
j
+
a
2
j
A
2
j
+
.
.
.
+
a
n
j
A
n
j
(
j
=
1
,
2
,
.
.
.
,
n
)
D=a_{1j}A_{1j}+a_{2j}A_{2j}+...+a_{nj}A_{nj}\ \ \ (j=1,2,...,n)
D=a1jA1j+a2jA2j+...+anjAnj (j=1,2,...,n)
这个法则可以根据引理与性质4或行列式计算式推导得到。 - 推论:行列式某一行(列)的元素与另一行(列)的对应元素的代数余子式乘积之和等于零,即
a
i
1
A
j
1
+
a
i
2
A
j
2
+
.
.
.
+
a
i
n
A
j
n
=
0
(
i
≠
j
)
a_{i1}A_{j1}+a_{i2}A_{j2}+...+a_{in}A_{jn} =0\ \ \ (i\neq j)
ai1Aj1+ai2Aj2+...+ainAjn=0 (i=j)或
a
1
i
A
1
j
+
a
2
i
A
2
j
+
.
.
.
+
a
n
i
A
n
j
=
0
(
i
≠
j
)
a_{1i}A_{1j}+a_{2i}A_{2j}+...+a_{ni}A_{nj}=0\ \ \ (i\neq j)
a1iA1j+a2iA2j+...+aniAnj=0 (i=j)
推论的证明根据性质3:行列式的某两行(列)元素相等或对应成比例,则行列式为零。
2.矩阵
2.1 定义
- 由
m
×
n
m\times n
m×n个数
a
i
j
(
i
=
1
,
2
,
.
.
.
,
m
;
j
=
1
,
2
,
.
.
.
,
n
)
a_{ij}(i=1,2,...,m;\ \ j=1,2,...,n)
aij(i=1,2,...,m; j=1,2,...,n)排成的
m
m
m行
n
n
n列的数表
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋮
a
m
1
a
m
2
⋯
a
m
n
\begin{array}{c} a_{11} &a_{12} &\cdots &a_{1n} \\ a_{21} &a_{22} &\cdots &a_{2n} \\ \vdots &\vdots &\ &\vdots \\ a_{m1} &a_{m2} &\cdots &a_{mn}\\ \end{array}
a11a21⋮am1a12a22⋮am2⋯⋯ ⋯a1na2n⋮amn称为m行n列矩阵,简称
m
×
n
m\times n
m×n矩阵,记作
A
=
(
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋮
a
m
1
a
m
2
⋯
a
m
n
)
A=\left(\begin{array}{c} a_{11} &a_{12} &\cdots &a_{1n} \\ a_{21} &a_{22} &\cdots &a_{2n} \\ \vdots &\vdots &\ &\vdots \\ a_{m1} &a_{m2} &\cdots &a_{mn}\\ \end{array}\right)
A=
a11a21⋮am1a12a22⋮am2⋯⋯ ⋯a1na2n⋮amn
简记为
A
=
A
m
×
n
=
(
a
i
j
)
m
×
n
=
(
a
i
j
)
A=A_{m\times n}=(a_{ij})_{m\times n}=(a_{ij})
A=Am×n=(aij)m×n=(aij)。
这 m × n m\times n m×n个数称为矩阵A的元素,简称为元。元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵。
行数和列数都等于n的矩阵称为n阶矩阵或n阶方阵。
2.1.1 矩阵与行列式概念区分
2.1.2 矩阵与线性变换
线性变换与矩阵之间存在着一一对应关系
由于矩阵和线性变换之间存在一一对应的关系,因此可以利用矩阵来研究线性变换,也可以利用线性变换来解释矩阵的含义。
2.2 矩阵的运算
2.2.1 矩阵的加法
- 定义:设由两个
m
×
n
m\times n
m×n矩阵
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij)和
B
=
(
b
i
j
)
B=(b_{ij})
B=(bij),那么矩阵A与B的和记作A+B,规定为
A
+
B
=
(
a
11
+
b
11
a
12
+
b
12
⋯
a
1
n
+
b
1
n
a
21
+
b
21
a
22
+
b
22
⋯
a
2
n
+
b
2
n
⋮
⋮
⋮
a
m
1
+
b
m
1
a
m
2
+
b
m
2
⋯
a
m
n
+
b
m
n
)
A+B=\left(\begin{array}{c} a_{11}+b_{11} &a_{12}+b_{12} &\cdots &a_{1n}+b_{1n} \\ a_{21}+b_{21} &a_{22}+b_{22} &\cdots &a_{2n}+b_{2n} \\ \vdots &\vdots &\ &\vdots \\ a_{m1}+b_{m1} &a_{m2}+b_{m2} &\cdots &a_{mn}+b_{mn} \\ \end{array}\right)
A+B=
a11+b11a21+b21⋮am1+bm1a12+b12a22+b22⋮am2+bm2⋯⋯ ⋯a1n+b1na2n+b2n⋮amn+bmn
注意:只有两个矩阵同型时(行数等于行数、列数等于列数),这两个矩阵才能进行加法运算。
行列式加法是某行或某列加,矩阵是同型矩阵对应元素一一相加 - 矩阵加法的运算规律
- 交换律: A + B = B + A A+B=B+A A+B=B+A
- 结合律: ( A + B ) + C = A + ( B + C ) (A+B)+C=A+(B+C) (A+B)+C=A+(B+C)
- 矩阵减法相当于:
A
−
B
=
A
+
(
−
B
)
A-B=A+(-B)
A−B=A+(−B)
其中 − B -B −B称为B的负矩阵,有: B + ( − B ) = O B+(-B)=O B+(−B)=O
2.2.2 数与矩阵相乘
- 定义:数
λ
\lambda
λ与矩阵
A
A
A的乘积记作
λ
A
\lambda A
λA或
A
λ
A\lambda
Aλ,规定为
λ
A
=
A
λ
=
(
λ
a
11
λ
a
12
⋯
λ
a
1
n
λ
a
21
λ
a
22
⋯
λ
a
2
n
⋮
⋮
⋮
λ
a
m
1
λ
a
m
2
⋯
λ
a
m
n
)
\lambda A=A\lambda=\left(\begin{array}{c} \lambda a_{11} &\lambda a_{12} &\cdots &\lambda a_{1n} \\ \lambda a_{21} &\lambda a_{22} &\cdots &\lambda a_{2n} \\ \vdots &\vdots &\ &\vdots \\ \lambda a_{m1} &\lambda a_{m2} &\cdots &\lambda a_{mn} \\ \end{array}\right)
λA=Aλ=
λa11λa21⋮λam1λa12λa22⋮λam2⋯⋯ ⋯λa1nλa2n⋮λamn
行列式数乘是乘某行(列),矩阵数乘是乘每个元素 - 矩阵数乘的运算规律
- 结合律: ( λ μ ) A = λ ( μ A ) (\lambda \mu)A=\lambda (\mu A) (λμ)A=λ(μA)
- 分配律: ( λ + μ ) A = λ A + μ A (\lambda +\mu)A=\lambda A+\mu A (λ+μ)A=λA+μA, λ ( A + B ) = λ A + λ B \lambda(A+B)=\lambda A+\lambda B λ(A+B)=λA+λB
2.2.3 矩阵与矩阵相乘
- 定义:设
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij)是一个
m
×
s
m\times s
m×s矩阵,
B
=
(
b
i
j
)
B=(b_{ij})
B=(bij)是一个
s
×
n
s\times n
s×n矩阵,那么规定矩阵
A
A
A与矩阵
B
B
B的乘积是一个
m
×
n
m\times n
m×n矩阵
C
=
(
c
i
j
)
C=(c_{ij})
C=(cij),其中
c
i
j
=
a
i
1
b
1
j
+
a
i
2
b
2
j
+
⋯
+
a
i
s
b
s
j
=
∑
k
=
1
s
a
i
k
b
k
j
(
i
=
1
,
2
,
⋯
,
m
;
j
=
1
,
2
,
⋯
,
n
)
c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots +a_{is}b_{sj}=\sum^s_{k=1}a_{ik}b_{kj} \\(i=1,2,\cdots,m;\ j=1,2,\cdots,n)
cij=ai1b1j+ai2b2j+⋯+aisbsj=k=1∑saikbkj(i=1,2,⋯,m; j=1,2,⋯,n)并把此乘积记作
C
=
A
B
C=AB
C=AB
显然,只有左矩阵的列数等于右矩阵的行数时,两个矩阵才能相乘 - 矩阵乘法的运算规律
- 结合律: ( A B ) C = A ( B C ) (AB)C=A(BC) (AB)C=A(BC)
- 数乘的结合律: λ ( A B ) = ( λ A ) B = A ( λ B ) \lambda (AB)=(\lambda A)B=A(\lambda B) λ(AB)=(λA)B=A(λB)
- 分配律: A ( B + C ) = A B + A B , ( B + C ) A = B A + C A A(B+C)=AB+AB,(B+C)A=BA+CA A(B+C)=AB+AB,(B+C)A=BA+CA
- 单位矩阵再矩阵乘法中作用类似于数字1:
E
m
A
m
×
n
=
A
m
×
n
E
n
=
A
E_mA_{m\times n}=A_{m\times n}E_n=A
EmAm×n=Am×nEn=A
推论:矩阵乘法不一定满足交换律,但是纯量阵 λ E \lambda E λE与任何同阶方阵都是可交换的,即: ( λ E n ) A n = λ A n = A n ( λ E n ) (\lambda E_n)A_n=\lambda A_n=A_n(\lambda E_n) (λEn)An=λAn=An(λEn)
2.2.4 矩阵的幂运算
- 定义:设
A
A
A是n阶方阵,定义
A
1
=
A
,
A
2
=
A
1
A
1
,
…
,
A
k
+
1
=
A
k
A
1
,
A^1=A,A^2=A^1A^1,\dots,A^{k+1}=A^kA^1,
A1=A,A2=A1A1,…,Ak+1=AkA1,
其中 k k k为正整数,显然只有方阵的幂才有意义 - 矩阵的幂满足的运算规律
- A k A l = A k + l A^kA^l=A^{k+l} AkAl=Ak+l
- ( A k ) l = A k l (A^k)^l=A^{kl} (Ak)l=Akl
2.2.5 矩阵的转置
- 定义:把矩阵
A
A
A的行换成同序数的列得到的新矩阵,叫做
A
A
A的转置矩阵,记作
A
T
A^T
AT
注意:若 A = A T A=A^T A=AT,则将A称为对称阵;若 A = − A T A=-A^T A=−AT,则将A称为反对称阵。 - 转置矩阵的运算性质
- ( A T ) T = A (A^T)^T=A (AT)T=A
- ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
- ( λ A ) T = λ A T (\lambda A)^T=\lambda A^T (λA)T=λAT
- ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT(穿脱原则)
2.2.6 方阵的行列式
- 定义:由
n
n
n阶方阵
A
A
A的元素所构成的行列式(各元素的位置不变),称为方阵
A
A
A的行列式,记作
d
e
t
A
detA
detA或
∣
A
∣
|A|
∣A∣。
注意:方阵与行列式是两个不同概念, n n n阶方阵是 n 2 n^2 n2个数按一定方式排列成的数表,而 n n n阶行列式则是这个数表的数按一定的运算法则所确定的一个数。 - 由
A
A
A确定的
∣
A
∣
|A|
∣A∣满足的运算规律
- ∣ A T ∣ = ∣ A ∣ |A^T|=|A| ∣AT∣=∣A∣(行列式性质1)
- ∣ λ A ∣ = λ n ∣ A ∣ |\lambda A|= \lambda^n|A| ∣λA∣=λn∣A∣
- ∣ A B ∣ = ∣ A ∣ ∣ B ∣ |AB|=|A||B| ∣AB∣=∣A∣∣B∣
2.2.7 伴随矩阵
- 定义:行列式 ∣ A ∣ |A| ∣A∣的各个元素的代数余子式 ∣ A i j ∣ |A_{ij}| ∣Aij∣所构成的如下的矩阵 A ∗ = ∣ A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋯ ⋯ ⋯ ⋯ A 1 n A 2 n ⋯ A n n ∣ A^*=\left|\begin {array}{c} A_{11} &A_{21} &\cdots &A_{n1} \\ A_{12} &A_{22} &\cdots &A_{n2} \\ \cdots &\cdots &\cdots &\cdots \\ A_{1n} &A_{2n} &\cdots &A_{nn} \\ \end{array}\right| A∗= A11A12⋯A1nA21A22⋯A2n⋯⋯⋯⋯An1An2⋯Ann 称为矩阵A的伴随矩阵。
- 伴随矩阵满足的性质:
A A ∗ = A ∗ A = ∣ A ∣ E AA^*=A^*A=|A|E AA∗=A∗A=∣A∣E
2.3 逆矩阵
2.3.1 定义
- 对于n阶矩阵 A A A,如果有一个n阶矩阵 B B B,使 A B = B A = E , AB=BA=E, AB=BA=E,则说矩阵 A A A是可逆的,并把矩阵 B B B称为 A A A的逆矩阵,简称逆阵。
- 若矩阵 A A A是可逆的,那么 A A A的逆矩阵是唯一的。
- A A A的逆矩阵记作 A − 1 A^{-1} A−1,即若 A B = B A = E ,则 B = A − 1 AB=BA=E,则B=A^{-1} AB=BA=E,则B=A−1。
2.3.2 相关定理
- 若矩阵 A A A可逆,则 ∣ A ∣ ≠ 0 |A|\neq 0 ∣A∣=0
- 若
∣
A
∣
≠
0
|A|\neq 0
∣A∣=0,则矩阵
A
A
A可逆,且
A
−
1
=
1
∣
A
∣
A
∗
A^{-1}=\frac{1}{|A|}A^*
A−1=∣A∣1A∗
由定理1和2可知, A A A是可逆矩阵的充分必要条件是 ∣ A ∣ ≠ 0 |A|\neq 0 ∣A∣=0,即可逆矩阵就是非奇异矩阵。
推论:
- 若 A B = E (或 B A = E ) , 则 B = A − 1 AB=E(或BA=E),则B=A^{-1} AB=E(或BA=E),则B=A−1
- 如果 A 、 B A、B A、B为同阶矩阵且均可逆,则 A − 1 、 A T 、 λ A ( λ ≠ 0 ) 与 A B A^{-1}、A^T、\lambda A(\lambda \neq 0)与AB A−1、AT、λA(λ=0)与AB也可逆,且 ( A − 1 ) − 1 = A ( A T ) − 1 = ( A − 1 ) T ( λ A ) − 1 = 1 λ A − 1 ( A B ) − 1 = B − 1 A − 1 (A^{-1})^{-1}=A\\ (A^T)^{-1}=(A^{-1})^T\\ (\lambda A)^{-1}=\frac{1}{\lambda}A^{-1}\\ (AB)^{-1}=B^{-1}A^{-1} (A−1)−1=A(AT)−1=(A−1)T(λA)−1=λ1A−1(AB)−1=B−1A−1
2.4 矩阵的初等变换与线性方程组
2.4.1 矩阵的初等变换
- 定义:下面三种变换称为矩阵的初等行变换:
- 对换两行(对换 i , j i,j i,j两行,记作 r i ↔ r j r_i \leftrightarrow r_j ri↔rj);
- 以数 k ≠ 0 k \neq 0 k=0乘某一行中的所有元(第 i i i行乘 k k k,记作 r i × k r_i \times k ri×k);
- 把某一行所有元的 k k k倍加到另一行对应的元上去(第 j j j行的 k k k倍加到第 i i i行上,记作 r i + k r j r_i+kr_j ri+krj).
把定义中的“行”换成“列”,即得矩阵的初等列变换的定义(所用记号是把“r”换成“c”)
矩阵的初等行变换与初等列变换,统称初等变换。
- 显然,三种初等变换都是可逆的,且其逆变换是同一类型的初等变换:
- r i ↔ r j r_i \leftrightarrow r_j ri↔rj的逆变换是其本身
- r i × k r_i \times k ri×k的逆变换是 r i × ( 1 k ) r_i \times (\frac{1}{k}) ri×(k1)(或记作 r i ÷ k r_i \div k ri÷k)
- r i + k r j r_i+kr_j ri+krj的逆变换为 r i + ( − k ) r j r_i+(-k)r_j ri+(−k)rj(或记作 r i − k r j r_i-kr_j ri−krj)
2.4.2 矩阵之间的等价关系
如果矩阵
A
A
A经有限次初等行变换变成矩阵
B
B
B,就称矩阵
A
A
A与
B
B
B行等价,记作
A
∼
r
B
A\stackrel{r}{\sim}B
A∼rB;如果矩阵
A
A
A经有限次初等列变换变成矩阵
B
B
B,就称矩阵
A
A
A与
B
B
B列等价,记作
A
∼
c
B
A\stackrel{c}{\sim}B
A∼cB;如果矩阵
A
A
A经有限次初等变换变成矩阵
B
B
B,就称矩阵
A
A
A与
B
B
B等价,记作
A
∼
B
A\sim B
A∼B。
- 矩阵之间的等价关系具有下列性质:
- 反身性: A ∼ A A\sim A A∼A;
- 对称性:若 A ∼ B A\sim B A∼B,则 B ∼ A B\sim A B∼A;
- 传递性:若 A ∼ B A\sim B A∼B, B ∼ C B\sim C B∼C,则 A ∼ C A\sim C A∼C.
我们可以通过初等变换来将矩阵变换为“阶梯形”,便于计算:
这些矩阵相互之间的关系可以用下图表示:
2.5 初等变换与矩阵乘法的关系
2.5.1 初等矩阵
- 定义:由单位矩阵
E
E
E经过一次初等变换得到的矩阵称为初等矩阵。其中三种初等变换对应有三种初等矩阵
- 把单位矩阵中第 i , j i,j i,j两行对换(或第 i , j i,j i,j两列对换)
- 以数 k ≠ 0 k\neq 0 k=0乘单位矩阵的第 i i i行(或第 i i i列)
- 以 k k k乘单位矩阵的第 j j j行加到第 i i i行上或以 k k k乘单位矩阵的第 i i i列加到第 j j j列上
- 定理:设
A
A
A与
B
B
B为
m
×
n
m\times n
m×n矩阵,那么
- A ∼ r B A\stackrel{r}{\sim}B A∼rB的充分必要条件是存在 m m m阶可逆矩阵 P P P,使 P A = B PA=B PA=B;
- A ∼ c B A\stackrel{c}{\sim}B A∼cB的充分必要条件是存在 n n n阶可逆矩阵 Q Q Q,使 A Q = B AQ=B AQ=B;
-
A
∼
B
A\sim B
A∼B的充分必要条件是存在
m
m
m阶可逆矩阵
P
P
P及
n
n
n阶可逆矩阵
Q
Q
Q,使
P
A
Q
=
B
PAQ=B
PAQ=B.
以上定理可以用初等矩阵与矩阵 A A A左乘与右乘证得,同时引出下面定义。
2.5.2 初等变换与矩阵乘法
- 性质:设
A
A
A是一个
m
×
n
m\times n
m×n矩阵,对
A
A
A施行一次初等行变换,相当于在
A
A
A的左边乘相应的
m
m
m阶初等矩阵;对
A
A
A施行一次初等列变换,相当于在
A
A
A的右边乘相应的
n
n
n阶初等矩阵。
2.6 矩阵的秩
2.6.1 秩
- 定义:设在矩阵
A
A
A中有一个不等于0的
r
r
r阶子式
D
D
D,且所有
r
+
1
r+1
r+1阶子式(如果存在的话)全等于0,那么
D
D
D称为矩阵
A
A
A的最高阶非零子式,数
r
r
r称为矩阵
A
A
A的秩,记作
R
(
A
)
R(A)
R(A)。并规定零矩阵的秩等于0
矩阵 A A A的秩就是 A A A中非零子式的最高阶数 - 关于矩阵的秩有以下结论:
- 一般的矩阵,当行数和列数较高时,按定义求秩是很麻烦的,一个自然的想法是用初等变换将一般的矩阵化为行阶梯形矩阵,行阶梯形矩阵的秩就等于非零行的行数,而两个等价的矩阵的秩相等。
- 矩阵的秩的性质:
2.6.2 结合秩判断线性方程组的解
3.向量组的线性相关性
3.1 向量组及其线性组合
- 向量定义:
n
n
n个有次序的数
a
1
,
a
2
,
⋯
,
a
n
a_1,a_2,\cdots,a_n
a1,a2,⋯,an所组成的数组称为
n
n
n维向量 ,这
n
n
n个数称为该向量的
n
n
n个分量,第
i
i
i个数
a
i
a_i
ai称为第
i
i
i个分量。
- 分量全为实数的向量称为实向量
- 分量为复数的向量称为复向量
- 向量分为行向量和列向量
- 向量组定义:若干个同维数的列向量(或同维数的行向量)所组成的集合叫做向量组。
- 定理:向量
b
b
b能由向量组
A
:
a
1
,
a
2
,
⋯
,
a
m
A:a_1,a_2, \cdots,a_m
A:a1,a2,⋯,am线性表示的充分必要条件是矩阵
A
=
(
a
1
,
a
2
,
⋯
,
a
m
)
A=(a_1,a_2, \cdots,a_m)
A=(a1,a2,⋯,am)的秩等于矩阵
B
=
(
b
1
,
b
2
,
⋯
,
b
m
)
B=(b_1,b_2, \cdots,b_m)
B=(b1,b2,⋯,bm)的秩。
- 定理:向量组
B
:
b
1
,
b
2
,
⋯
,
b
l
B:b_1,b_2, \cdots,b_l
B:b1,b2,⋯,bl能由向量组
A
:
a
1
,
a
2
,
⋯
,
a
m
A:a_1,a_2, \cdots,a_m
A:a1,a2,⋯,am线性表示的充分必要条件是矩阵
A
=
(
a
1
,
a
2
,
⋯
,
a
m
)
A=(a_1,a_2, \cdots,a_m)
A=(a1,a2,⋯,am)的秩等于矩阵
(
A
,
B
)
=
(
a
1
,
⋯
,
a
m
,
b
1
,
⋯
,
b
l
)
(A,B)=(a_1, \cdots,a_m,b_1, \cdots,b_l)
(A,B)=(a1,⋯,am,b1,⋯,bl)的秩,即
R
(
A
)
=
R
(
A
,
B
)
R(A)=R(A,B)
R(A)=R(A,B)
推论:向量组 A : a 1 , a 2 , ⋯ , a m A:a_1,a_2, \cdots,a_m A:a1,a2,⋯,am与向量组 B : b 1 , b 2 , ⋯ , b l B:b_1,b_2, \cdots,b_l B:b1,b2,⋯,bl等价的充分必要条件是 R ( A ) = R ( B ) = R ( A , B ) R(A)=R(B)=R(A,B) R(A)=R(B)=R(A,B)
3.2 向量组的线性相关性
-
定义:给定向量组 A : a 1 , a 2 , ⋯ , a m A:a_1,a_2, \cdots,a_m A:a1,a2,⋯,am,如果存在不全为零的数 k 1 , k 2 , ⋯ , k m k_1,k_2, \cdots,k_m k1,k2,⋯,km使 k 1 a 1 , k 2 a 2 , ⋯ , k m a m = 0 , k_1a_1,k_2a_2, \cdots,k_ma_m=0, k1a1,k2a2,⋯,kmam=0,则称向量组 A A A是线性相关的,否则称它线性无关
-
线性相关与线性无关有其几何意义:
-
线性相关与线性无关的判断非常重要:
-
定理:
3.3 向量组的秩
- 定义:设有向量组
A
A
A ,如果在 $A $中能选出
r
r
r个向量
a
1
,
a
2
,
⋯
,
a
r
a_1,a_2, \cdots,a_r
a1,a2,⋯,ar满足:
- 向量组 A 0 : a 1 , a 2 , ⋯ , a r A_0 :a_1, a_2, \cdots, a_r A0:a1,a2,⋯,ar线性无关;
- 向量组
A
A
A中任意
r
+
1
r + 1
r+1个向量(如果
A
A
A中有
r
+
1
r + 1
r+1个向量的话)都线性相关;
那么称向量组 A 0 A_0 A0是向量组 A A A的一个最大线性无关向量组,简称最大无关组.
最大无关组所含向量个数 r r r称为向量组 A A A的秩,记作 R A R_A RA .
3.4 线性方程组的解的结构
- 基础解系
- 解的关系
3.5 向量空间
3.5.1 向量空间定义
- 设 V V V为 n n n维向量的集合,如果集合 V V V非空,且集合 V V V非空,且集合 V V V对于向量的加法及数乘两种运算封闭,那么就称集合 V V V为向量空间。
- 所谓封闭,是指在集合 V V V中可以进行向量的加法以及数乘两种运算。具体地说,就是:若 a ∈ V , b ∈ V a \in V, b \in V a∈V,b∈V,则 a + b ∈ V a+b \in V a+b∈V;若 a ∈ V , λ ∈ R a \in V, \lambda \in R a∈V,λ∈R,则 λ a ∈ V \lambda a \in V λa∈V。
3.5.2 向量空间的基的概念
相对应的坐标概念:
4.相似矩阵及二次型
4.1 向量的内积、长度及正交性
4.1.1 向量的内积
- 内积具有下列性质:
- [ x , y ] = [ y , x ] [x,y]=[y,x] [x,y]=[y,x]
- [ λ x , y ] = λ [ x , y ] [\lambda x,y]=\lambda[x,y] [λx,y]=λ[x,y]
- [ x + y , z ] = [ x , z ] + [ y , z ] [x+y,z]=[x,z]+[y,z] [x+y,z]=[x,z]+[y,z]
- 当 x = 0 x=0 x=0时, [ x , x ] = 0 [x,x]=0 [x,x]=0;当 x ≠ 0 x \neq 0 x=0时, [ x , x ] > 0 [x,x]>0 [x,x]>0
4.1.2 向量的长度
- 向量长度具有下列性质:
- 非负性:当 x ≠ 0 x \neq 0 x=0时, ∣ ∣ x ∣ ∣ > 0 ||x||>0 ∣∣x∣∣>0;当 x = 0 x=0 x=0时, ∣ ∣ x ∣ ∣ = 0 ||x||=0 ∣∣x∣∣=0
- 齐次性: ∣ ∣ λ x ∣ ∣ = ∣ λ ∣ ∣ ∣ x ∣ ∣ ||\lambda x||=|\lambda| ||x|| ∣∣λx∣∣=∣λ∣∣∣x∣∣
4.1.3 正交向量组
- 当
[
x
,
y
]
=
0
[x,y]=0
[x,y]=0时,称向量
x
x
x和向量
y
y
y正交。
4.1.4 求规范正交基的方法
思路:基
⇒
\Rightarrow
⇒正交基
⇒
\Rightarrow
⇒规范正交基
4.1.5 正交矩阵及正交变换
4.2 方阵的特征值和特征向量
上面定义式可以进行以下推导:
特征值有以下相关结论:
设
n
n
n阶矩阵
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij)
特征值与特征向量有以下定理:
4.3 相似矩阵
那么求相似变换矩阵
P
P
P,使
P
−
1
A
P
=
Λ
P^{-1}AP= \Lambda
P−1AP=Λ为对角矩阵,这就称为把矩阵
A
A
A对角化
4.4 对称矩阵的对角化
判断是否能够对角化:
对称矩阵对角化步骤:
4.5 二次型
4.5.1 二次型及其标准型
将二次型变成标准型:
4.5.2 矩阵合同
观察二次型的矩阵表示方式与合同的定义式,发现相同点。
4.5.3 化二次型为标准型
4.5.4 正定二次型
5.线性空间与线性变换
5.1 线性空间的定义与性质
- 线性空间的性质:
- 零元素是唯一的,任意元素的负元素也是唯一的
- 如下等式成立:
0
⋅
α
=
0
,
(
−
1
)
α
=
−
α
0·\alpha =0,(-1)\alpha = -\alpha
0⋅α=0,(−1)α=−α
注意:一组向量要么线性相关要么线性无关,不存在第三种情况
5.2 维数、基与坐标
注意(基):
注意(坐标):
过渡矩阵:
5.3 坐标变换
5.4 线性变换
5.4.1 线性映射
- 概念:
线性映射概念:
相关性质:
5.4.2 线性映射的矩阵表示
5.4.2 线性变换的矩阵表示
线性变换概念:
线性变换的矩阵表示:
线性变换的运算: