根据状态空间方程的一般表达式,求解矩阵形式的微分方程可以掌握系统状态变量随时间的变化的解为
\[z\left(t\right)=\mathrm{e}^{A\left(t-t_{0}\right)}z\left(t_{0}\right)+\int_{t_{0}}^{t}\mathrm{e}^{A\left(t-\tau\right)}Bu\left(\tau\right)\mathrm{d}\tau \]可以发现 z(t)由两部分组成,第一部分只和系统的初始条件 \(z(t_0)\)相关,而第二部分是一个卷积,与系统的输人相关。包含了卷积,而且指数部分还出现矩阵,因此增加了分析求解的难度和复杂程度。引人了拉普拉斯变换和传递函数来绕开求解微分方程和卷积,从而简化了系统的分析。
而对于状态空间方程,使用相平面与相轨迹的方法可以快速有效地分析系统。在讲解这一数学工具之前,首先回顾线性代数中的一个重要概念——矩阵的特征值与特征向量。
矩阵的特征值和特征向量
在线性代数中,对于一个给定的方阵\(A\) ,它的特征向量\(v\)经过矩阵\(A\)线性变换的作用之后,得到的新的向量仍然与原来的\(v\) 保持在同一条直线上,但其长度或方向也许会改变。即
\[A\:v=\lambda\:v \]其中,\(\lambda\)为标量,即特征向量的长度在矩阵\(A\)线性变换下缩放的比例,称为矩阵 A 的特征值。
首先来看线性变换,假设有一个二维矩阵 \(A\) 与 一 个 向 量 \(v_a\), 其中
\[\mathbf{A}= \begin{bmatrix} 1&1\\ 4&-2 \end{bmatrix},\quad \mathbf{v}_\mathbf{a}= \begin{bmatrix}1\\ 2 \end{bmatrix} \]用矩阵A 左乘以 \(v_\mathrm{a}\) ,根据矩阵的乘法法则,可得
\[\mathbf{A} \mathbf{v}_{\mathbf{a}}=\begin{bmatrix}1&1\\4&-2\end{bmatrix} \begin{bmatrix}1\\2\end{bmatrix}=\begin{bmatrix}1\times1+1\times2\\4\times1+(-2)\times2\end{bmatrix}=\begin{bmatrix}3\\0\end{bmatrix} \]从\(v_\mathrm{a}\)到\(Av_\mathrm{a}\)的过程称为线性变换,向量\(v_\mathrm{a}\)经过矩阵\(A\)线性变换后,长度发生了改变,而且不再和原向量保持在一条直线上。
再来考虑另一个向量 $ \boldsymbol{v}_\mathrm{b}=[1,1]^\mathrm{T} $,对它进行同样的通过矩阵 A 的线性变换,可得
\[\boldsymbol{A}\boldsymbol{v}_\mathbf{b}=\begin{bmatrix}1&1\\4&-2\end{bmatrix}\begin{bmatrix}1\\1\end{bmatrix}=\begin{bmatrix}2\\2\end{bmatrix}=2\begin{bmatrix}1\\1\end{bmatrix}=\lambda\boldsymbol{v}_\mathbf{b} \]说明通过矩阵\(A\) 线性变换后,\(A\boldsymbol v_{\mathrm{b}}=\lambda\boldsymbol{v}_{\mathrm{b}}=2\boldsymbol{v}_{\mathrm{b}}\)。经过变换后的新向量与原向量在一条直线上,但是长度发生了改变。根据定义,\(v_\mathrm{b}\)是矩阵\(A\)的特征向量,缩放比例\(\lambda=2\)则是矩阵\(A\)对应于特征向量\(v_\mathrm{b}\)的特征值。
现在以矩阵\(A\)为例,说明如何求解特征值与特征向量。根据式(3.2.2),可得
\[\begin{aligned}&\boldsymbol{A}\boldsymbol{v}-\lambda\boldsymbol{v}=0\\\Rightarrow&(\boldsymbol{A}-\lambda\boldsymbol{I})\boldsymbol{v}=0\end{aligned} \]其中,\(I\) 为单位矩阵,维度与\(A\) 相同。
根据矩阵理论,如果式(3.2.6)有非零解,则矩阵(\(A-\lambda I\))的行列式必须为零,即
\[\mid A-\lambda I\mid=0 \]将\(\boldsymbol{A}=\begin{bmatrix}1&1\\4&-2\end{bmatrix}\)代人式
\[\begin{vmatrix}1-\lambda&1\\4&-2-\lambda\end{vmatrix}=0 \]即
\[\begin{aligned}&(1-\lambda)(-2-\lambda)-1\times4=0\\\Rightarrow&\lambda^{2}+\lambda-6=0\end{aligned} \]式称为矩阵 A 的特征方程(Characteristic Equation)。可以得到矩阵 A 的两个特征值:
\[\lambda_1=2\\\lambda_2=-3 \]将式可得到不同特征值所对应的特征向量。例如当\(\lambda_{1}=2\)时,对应的特征向量为\(\boldsymbol v_1=\begin{bmatrix}v_{11},v_{12}\end{bmatrix}^\mathrm{T}\),可得
\[\begin{aligned}&(\boldsymbol{A}-\lambda_{1}\boldsymbol{I})\boldsymbol{v}_{1}=\begin{bmatrix}1-2&1\\4&-2-2\end{bmatrix}\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix}=\begin{bmatrix}-1&1\\4&-4\end{bmatrix}\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix}=0\\&\Rightarrow\begin{cases}-v_{11}+v_{12}=0\\4v_{11}-4v_{12}=0\end{cases}\\&\Rightarrow v_{11}=v_{12}\end{aligned} \]说明特征向量\(v_1\)存在于\(v_{11}=v_{12}\)这一条直线上。可以任意取其中的一组,例如选取\(v_{11}=v_{12}=1\), 那么矩阵\(A\)对应于特征值\(\lambda_1=2\)的特征向量为
\[\boldsymbol{v}_1=\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix}=\begin{bmatrix}1\\1\end{bmatrix} \]\(\boldsymbol{v}_1\) 通过矩阵 \(\boldsymbol{A}\) 的 线 性 变 换 后 得 到 \(\boldsymbol{A}\boldsymbol{v}_1= [ 2, 2] ^\mathrm{T} = 2\boldsymbol{v}_1\),同理,可以计算\(v_2\),即特征值 \(\lambda_2=-3\) 时的特征向量,可得
\[\begin{aligned}&(\boldsymbol{A}-\lambda_{2}\boldsymbol{I})\boldsymbol{v}_{2}=\begin{bmatrix}1+3&1\\4&-2+3\end{bmatrix}\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}=\begin{bmatrix}4&1\\4&1\end{bmatrix}\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}=0\\&\begin{cases}4v_{21}+v_{22}=0\\4v_{21}+v_{22}=0\end{cases}\\&\Rightarrow v_{21}=-\frac{1}{4}v_{22}\end{aligned} \]选取\(v_{21}=0.5,v_{22}=-2\)。那么,矩阵 \(A\) 对应于特征值\(\lambda_2=-3\) 的特征向量为
\[\boldsymbol{v}_2=\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}=\begin{bmatrix}&0.5\\&-2\end{bmatrix} \]此时\(, Av_2= \begin{bmatrix} 1& 1\\ 4& - 2\end{bmatrix} \begin{bmatrix} 0. 5\\ - 2\end{bmatrix} = \begin{bmatrix} - 1. 5\\ 6\end{bmatrix} = - 3v_2\) 。
特征值和特征向量的应用----线性方程解耦
特征值与特征向量的一个重要应用是将矩阵转化成对角矩阵,从而达到解耦(Decouple)的效果。解耦即解除耦合,而耦合是指一个系统里面的两个或以上的状态变量存在相互影响、相互关联的作用。考虑一个包含两个状态变量的系统,它的微分方程组为
\[\begin{cases}\frac{\mathrm{d}z_1\left(t\right)}{\mathrm{d}t}=z_1\left(t\right)+z_2\left(t\right)\\\frac{\mathrm{d}z_2\left(t\right)}{\mathrm{d}t}=4z_1\left(t\right)-2z_2\left(t\right)\end{cases} \]式(3.2.14)说明,系统状态变量 \(z_1(t)\)的变化率$ \frac {d z_1(t)}{dt} $ 除了与自身相关之外,还与 \(z_2(t)\)相关。而 \(z_2(t)\)的变化率\(\frac{\mathrm{d}z_2(t)}{\mathrm{d}t}\)同时是\(z_2(t)\)和 \(z_1(t)\)的函数,这样的两个状态变量就是耦合的。
对于耦合系统,分析单个状态变量的变化需要同时考虑两个变量,这是不容易做到的。将上述系统写成紧凑的状态空间方程,得到
其中
\[\mathbf{A}=\begin{bmatrix}1&&1\\4&&-2\end{bmatrix} \]若要解耦这个系统,首先需要定义过渡矩阵(Transition Matrix):
\[P=\begin{bmatrix}v_1,v_2\end{bmatrix}=\begin{bmatrix}v_{11}&v_{21}\\\\v_{12}&v_{22}\end{bmatrix} \]其中\(,v_1,v_2\)是矩阵\(A\)所对应的两个特征向量。用矩阵\(A\)左乘以过渡矩阵,可得
\[\mathbf{AP}=\mathbf{A}\begin{bmatrix}v_{11}&v_{21}\\v_{12}&v_{22}\end{bmatrix}=\begin{bmatrix}\mathbf{A}\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix}\mathbf{A}\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}\end{bmatrix} \]因为\(\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix}\)和\(\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}\)是矩阵 \(A\) 的特征向量,所以 \(A\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix}=\lambda_1\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix},\boldsymbol{A}\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}=\lambda_2\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}\)
\[AP=\begin{bmatrix}\lambda_1\\v_{12}\end{bmatrix}\lambda_2\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}=\begin{bmatrix}\lambda_1v_{11}&\lambda_2v_{21}\\\lambda_1v_{12}&\lambda_2v_{22}\end{bmatrix}=\begin{bmatrix}v_{11}&v_{21}\\v_{12}&v_{22}\end{bmatrix}\begin{bmatrix}\lambda_1&0\\0&\lambda_2\end{bmatrix}=\boldsymbol{PD}\ \]其中,\(\lambda_1\)和\(\lambda_2\)是特征向量\(v_1\)和\(v_2\)所对应的特征值。式(3.2.17)可以写成
其中\(,D=\begin{bmatrix}\lambda_1&0\\0&\lambda_2\end{bmatrix}\)是一个特征值位于对角线上的对角矩阵。现在对式等号两边
同时左乘以\(P^{-1}\),可得
\[\begin{aligned}P^{-1}AP&=P^{-1}PD\\\Rightarrow P^{-1}AP&=D\end{aligned} \]式(3,2,19)通过过渡矩阵\(P\)将原矩阵 A 对角化。
下面定义一组新的状态变量 \(\overline{\boldsymbol{z}}(t)\),令
将式代人式,可得
\[P\:\frac{\mathrm{d}\overline{z}\left(t\right)}{\mathrm{d}t}=AP\overline{z}\left(t\right) \]等号两边同时左乘以 \(P^{-1}\),得到
\[P^{-1}P\:\frac{\mathrm{d}\overline{z}\left(t\right)}{\mathrm{d}t}=P^{-1}AP\overline{z}\left(t\right) \]其中\(,P^{-1}P=I\) 是单位矩阵。根据式(3.2.19),\(P^{-1}AP=D\)。可得
\[\frac{\mathrm{d}\overline{z}\left(t\right)}{\mathrm{d}t}=\mathbf{D}\overline{z}\left(t\right)=\begin{bmatrix}\lambda_1&0\\0&\lambda_2\end{bmatrix}\overline{z}\left(t\right) \]即
\[\begin{cases}\dfrac{\mathrm{d}\overline{z}_1(t)}{\mathrm{d}t}=\lambda_1\overline{z}_1(t)\\\dfrac{\mathrm{d}\overline{z}_2(t)}{\mathrm{d}t}=\lambda_2\overline{z}_2(t)\end{cases} \]说明新的状态变量\(\bar{z}_1(t)\)和\(\bar{z}_2(t)\)的变化率只和自身相关,因此通过这样的一个变换之后,原来系统中的耦合关系就不再存在。而求解式则非常容易,根据微分方程的求解公式可得
\[\begin{cases}\overline{z}_1(t)=C_1\mathrm{e}^{\lambda_1t}\\ \overline{z}_2(t)=C_2\mathrm{e}^{\lambda_2t}\end{cases} \]其中,\(C_1\) 和\(C_2\) 是常数,与初始条件有关。
我们之前已经计算过了矩阵\(A\)的特征值及特征向量, 可得
可以得到系统的原状态变量 \(z(t)\)的表达式,即
\[z(t)=\mathbf{P}\overline{z}(t)=\begin{bmatrix}v_{11}&v_{21}\\v_{12}&v_{22}\end{bmatrix}\begin{bmatrix}C_{1} \mathrm{e}^{2t}\\C_{2} \mathrm{e}^{-3t}\end{bmatrix}=\begin{bmatrix}1&0.5\\1&-2\end{bmatrix}\begin{bmatrix}C_{1} \mathrm{e}^{2t}\\C_{2} \mathrm{e}^{-3t}\end{bmatrix}=\begin{bmatrix}C_{1} \mathrm{e}^{2t}+0.5C_{2} \mathrm{e}^{-3t}\\C_{1} \mathrm{e}^{2t}-2C_{2} \mathrm{e}^{-3t}\end{bmatrix} \]会发现状态矩阵\(A\) 的 特 征 值 \(\lambda _1= 2\)和\(\lambda_2=-3\)出现在指数的部分。它们将决定\(z(t\))随时间的变化趋势。例如\(,z_1(t)=C_1\mathrm{e}^{2t}+0.5C_2\mathrm{e}^{-3t}\) 的第一项| \(C_{1}\mathrm{e}^{2t}\)会随着时间的增加趋于无穷大,而第二项 0.5\(C_2\mathrm{e}^{-3t}\) 则会随着时间的增加趋于零。因此,这两项相加的结果也会随着时间的增加趋于无穷大。\(z_2(t)\)也有同样的表现。
综上所述,随着时间的增加,系统的状态变量z(t)会趋于无穷。以上解耦的方法也可以推广到更高阶的矩阵当中.
标签:特征值,begin,end,特征向量,boldsymbol,bmatrix,平面,lambda,mathrm From: https://www.cnblogs.com/redufa/p/18442245