现代控制理论线性系统入门(四)能控性和能观性
上一篇传送门:
现在我们来探讨线性时不变系统的一个重要性质——能控性(Steuerbarkeit)。
对于这样一个的线性时不变MIMO系统
(4.1) \mathbf{\dot x}=\mathbf{A x+Bu},\qquad \mathbf{ x}(0)=\mathbf{ x}_0
其中状态变量 \mathbf{ x}\in\mathbb{ R}^n ,输入变量 \mathbf{u}\in\mathbb{ R}^m ,动态矩阵 \mathbf{ A}\in\mathbb{ R}^{n\times n} ,控制矩阵 \mathbf{ B}\in\mathbb{ R}^{n\times m} 。
定义4.1 能控性
一个线性系统被称为完全能控,当且仅当在有限时间 T<\infty 内,任意初始条件 \mathbf{ x}(0)=\mathbf{ x}_0 都可经由一个连续的控制变量 \mathbf{ u}(t) ,在 t\in\left[ 0,T\right] 内,传导到达任意终值状态 \mathbf{ x}(T)=\mathbf{ x}_T 。
4.1 能控性
4.1.1 Kalman定义的能控性
为了考察系统的能控性,我们先看看状态变量的一般解形式
(4.2) \mathbf{ x}(t)=\mathbf{ \Phi}(t)\mathbf{ x}_0+\int_{0}^{t}\mathbf{ \Phi}(t-\tau)\mathbf{Bu}(\tau)d\tau
现在令 \mathbf{ x}_0=\mathbf{ 0} 并且选择时间 t=T ,会有
(4.3) \begin{align} \mathbf{ x}(T)&=\int_{0}^{T}\mathbf{ \Phi}(T-\tau)\mathbf{Bu}(\tau)d\tau=\int_{0}^{T}\sum_{k=0}^{\infty}\mathbf{ A}^k\frac{(T-\tau)^k}{k!}\mathbf{Bu}(\tau)d\tau\\ &=\sum_{k=0}^{\infty}\mathbf{ A}^k\mathbf{B\hat u}_k,~~\qquad \mathbf{\hat u}_k=\int_{0}^{T}\frac{(T-\tau)^k}{k!}\mathbf{ u}(\tau)d\tau \end{align}
从上式可知,输入变量目控制轨迹 \mathbf{ u}(t) 在确定的时间 t\in\left[ 0,T\right] 内都能用 m 维向量 \mathbf{\hat u}_k 表示。而目标终值 \mathbf{ x}(T) 可以看作各个矩阵 \mathbf{ B},\mathbf{AB},\mathbf{A}^2\mathbf{B},... 的线性组合。从而,对于任意点 \mathbf{ x}(T)\in\mathbb{ R}^n 上使得能控性有意义的一个必要的条件就会变成:由 \mathbf{ B},\mathbf{AB},\mathbf{A}^2\mathbf{B},... 各个矩阵的所有列向量能够张开成 \mathbb{ R}^n 的空间。
也就是说增广矩阵
(4.4) \left[ \mathbf{ B},\mathbf{AB},\mathbf{A}^2\mathbf{B},...,\mathbf{A}^{n-1}\mathbf{B},\mathbf{A}^{n}\mathbf{B},\mathbf{A}^{n+1}\mathbf{B},... \right]
必须要有 n 的秩,如此才能保证让所有 n 个状态变量 x_i 都是经过矩阵乘法后还能与 m 维的输入变量相作用中间变量导出的。如果秩低于 n ,意味着 n 行元素里面第 i 行都是0,这样最后控制变量 u_i 就无法作用,使得对应的 x_i 有值。
定理4.1 Cayley-Hamilton定理
多项式 p(\lambda)=p_0+p_1\lambda+...+p_{n-1}\lambda^{n-1}+\lambda^n 是矩阵 \mathbf{ A} 的特征多项式 p(\lambda)=det(\lambda\mathbf{ I}-\mathbf{ A})=0 , \mathbf{ A}\in\mathbb{ R}^{n\times n} ,那么有对应的关系
(4.5) p(\mathbf{ A})=p_0\mathbf{ I}+p_1\mathbf{ A}+...+p_{n-1}\mathbf{ A}^{n-1}+\mathbf{ A}^n=\mathbf{ 0}
Cayley-Hamilton定理指出,更高次幂的 \mathbf{A}^{n}\mathbf{B},\mathbf{A}^{n+1}\mathbf{B},... 都可以由低次幂 \mathbf{ A}^0,\mathbf{ A}^1,...,\mathbf{ A}^{n-1} 的线性组合得到,而需要确定的系数就是特征多项式 p(\lambda) 的系数。由此可见,更高次幂显然不会提供更多的秩,不过这也已经足够了,只需要检验前 n 个向量的线性无关性,于是有
定理4.2 Kalman的能控性判据
式(4.1)所指的系统完全能控,当且仅当能控性矩阵 \mathbf{ Q}_S 满秩,即
(4.6) \mathbf{ Q}_S=\left[ \mathbf{ B},\mathbf{AB},\mathbf{A}^2\mathbf{B},...,\mathbf{A}^{n-1}\mathbf{B}\right] 或者SISO系统的情况下
(4.7) \mathbf{ Q}_S=\left[ \mathbf{ b},\mathbf{Ab},\mathbf{A}^2\mathbf{b},...,\mathbf{A}^{n-1}\mathbf{b}\right] , Rank(\mathbf{ Q}_S)=n
当系统不是完全能控的,那么只有不足 n 维的子空间能控。
4.1.2 Hautus定义的能控性
除了Kalman给出的定义,还有Hautus的能控性定义,这是关于动态矩阵的特征值的分析
定理4.3 Hautus的能控性判据
式(4.1)所指的系统完全能控,当且仅当所有动态矩阵的特征值 \lambda_i 都满足
(4.8) Rank(\left[ \lambda_i \mathbf{ I-A},\mathbf{ B} \right])=n
Kalman判据要探讨一个 n\times (n\times m) 的矩阵的秩。跟Kalman的判据不同,Hautus只需要讨论一个 n\times (n+ m) 的矩阵的秩。而且Hautus判据还可以直接给出哪一个特征值是不可控的!这样Hautus判据可以在一些计算中比Kalman判据更简单。
Hautus判据也可以用来判断系统是否有 能稳定性 (Stabilisierbarkeit),系统是能稳定的,当且仅当所有不稳定的特征值 Re(\lambda_i)\geq 0 都完全能控。
4.1.3 SISO系统变形为能控标准型
一个系统如果是能控标准型,那么我们可以轻松读出传递函数,而且能控标准型便于控制器的设计,那么普通系统怎样变成变成能控标准型呢?我们先考察一个SISO的系统
(4.9) \begin{align} \mathbf{\dot x}&=\mathbf{A x+b}u,\qquad \mathbf{ x}(0)=\mathbf{ x}_0\\ y&=\mathbf{c^T x +}~du \end{align}
其中状态变量 \mathbf{ x}\in\mathbb{ R}^n ,输入标量变量 u\in\mathbb{ R} ,输出标量 y\in\mathbb{ R} 。设给出能满足条件的这样的可逆变换矩阵 \mathbf{T} ,那么有能控标准型下的系统变量坐标 \mathbf{\tilde x}=\mathbf{T x} ,变形完的能控标准型为
(4.10) \begin{align} \mathbf{\dot {\tilde {x}}}&=\underbrace{\begin{bmatrix} 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\ddots&\ddots&\vdots&\\ 0&0&\cdots&0&1\\ -a_0&-a_1&\cdots&-a_{n-2}&-a_{n-1} \end{bmatrix}}_{\mathbf{\tilde A=TAT}^{-1}}\mathbf{\tilde x}+\underbrace{\begin{bmatrix}0\\ 0\\ \vdots\\ 0\\ 1 \end{bmatrix}}_{\mathbf{\tilde b=Tb}}u\\ y&=\begin{bmatrix}b_0-a_0b_n&\cdots&b_{n-1}-a_{n-1}b_n\\ \end{bmatrix}\mathbf{\tilde x}+b_n u \end{align}
显然,在第一次出现控制量 u 以前,状态变量 \tilde x_1 必须至少 n 次可微,使用变换向量 \tilde x_1=\mathbf{t^T}\mathbf{x} ,代入原方程可得
(4.11) \begin{align} \dot {\tilde x}_1&=\tilde x_2=\mathbf{t^TAx+t^Tb}u,& \mathbf{t^Tb}&=0\\ \dot {\tilde x}_2&=\tilde x_3=\mathbf{t^TA}^2\mathbf{x+t^TAb}u,&\mathbf{t^TAb}&=0\\ &~~\vdots\\ {\tilde x}_1^{(n-1)}&=\tilde x_n=\mathbf{t^TA}^{n-1}\mathbf{x+}\mathbf{t^TA}^{n-2}\mathbf{b}u,&\mathbf{t^TA}^{n-2}\mathbf{b}&=0\\ {\tilde x}_1^{(n)}&=\dot {\tilde x}_n=\mathbf{t^TA}^{n}\mathbf{x+}\mathbf{t^TA}^{n-1}\mathbf{b}u,&\mathbf{t^TA}^{n-1}\mathbf{b}&=1\\ \end{align}
所以把限制条件的线性运算合写做矩阵相乘,得
(4.12) \mathbf{ t^T}\underbrace{\left[ \mathbf{ b},\mathbf{Ab},\mathbf{A}^2\mathbf{b},...,\mathbf{A}^{n-1}\mathbf{b}\right]}_{\mathbf{ Q}_S}=[0,...,0,1]
可见能控标准型和能控矩阵密切联系,当且仅当 \mathbf{ Q}_S 满秩可逆,才有变换向量
(4.13) \mathbf{ t^T}=[0,...,0,1]\mathbf{ Q}_S^{-1}
所以我们需要借助能控矩阵的逆矩阵的最后一行的元素才能确定能控标准型的变换向量和变换矩阵。总结如下
定理4.4 能控标准型的变换
如果式(4.9)决定的线性系统完全能控,那么才可以通过以下变换关系得到能控标准型
(4.14) \mathbf{T}=\begin{bmatrix} \mathbf{ t^T}\\\mathbf{t^TA}\\ \vdots\\\mathbf{t^TA}^{n-1} \end{bmatrix},\qquad \mathbf{ t^T}=[0,...,0,1]\mathbf{ Q}_S^{-1}, \qquad \mathbf{ Q}_S=\left[ \mathbf{ b},\mathbf{Ab},\mathbf{A}^2\mathbf{b},...,\mathbf{A}^{n-1}\mathbf{b}\right]
能控标准型能够直接看出传递函数,同样也可以反过来用传递函数直接读出能控标准型,而且在SISO系统里,控制变量 u 只会直接影响状态变量的最后一行,这对于控制器设计来说尤为便利。至于MIMO系统的能控标准型变换会在下一章节给出。
4.2 能观性
事实上,在绝大多数情况下,困扰我们的问题不是能控性,而是状态变量是否可以测得。系统的 能观性 (Beobachtabarkeit)就关乎这个问题:我们是否可以通过直接测量量 \mathbf{ y}(t) 以及输入控制量 \mathbf{ u}(t) 来重建状态变量的关系。
继续考察一个线性时不变的MIMO系统
(4.15) \begin{align} \mathbf{\dot x}&=\mathbf{A x+Bu},\qquad \mathbf{ x}(0)=\mathbf{ x}_0\\ \mathbf{y}&=\mathbf{C x+Du} \end{align}
其中状态变量 \mathbf{ x}\in\mathbb{ R}^n ,输入变量 \mathbf{u}\in\mathbb{ R}^m ,输出变量 \mathbf{y}\in\mathbb{ R}^p , \mathbf{ A}\in\mathbb{ R}^{n\times n} , \mathbf{ B}\in\mathbb{ R}^{n\times m} , \mathbf{ C}\in\mathbb{ R}^{p\times n} , \mathbf{ D}\in\mathbb{ R}^{p\times m} 。
定义4.2 能观性
一个线性系统被称为完全能观,当且仅当在有限时间 T<\infty 内,都可通过连续的控制变量 \mathbf{ u}(t) 以及测得的输出变量 \mathbf{ y}(t) 的信息,在 t\in\left[ 0,T\right] 内,完全确定初始状态 \mathbf{ x}(0)=\mathbf{ x}_0 。
4.2.1 Kalman定义的能观性
如同对能观性的考察,我们回顾最后系统的输出变量的解
(4.16) \mathbf{ y}(t)=\mathbf{ C\Phi}(t)\mathbf{ x}_0+\int_{0}^{t}\mathbf{ C\Phi}(t-\tau)\mathbf{Bu}(\tau)d\tau\mathbf{+Du}(t)
假设输入量和输出量轨迹全部已知,显然后两项对确定初始条件 \mathbf{ x}_0 没有影响。而为了简化探求能观性的难度,再让输入量始终置零 \mathbf{ u}(t)\equiv\mathbf{ 0} ,原式就简化为
(4.17) \mathbf{ y}(t)=\mathbf{ C\Phi}(t)\mathbf{ x}_0
另一个对于考察能观性必要的条件是,假设存在一个非零向量 \mathbf{ a}\ne\mathbf{ 0} 使得
(4.18) \mathbf{ CA}^k\mathbf{a}=\mathbf{ 0},\quad\quad k=1,2,...
于是就可以得出
(4.19) \mathbf{ y}(t)=\mathbf{ C\Phi}(t)\mathbf{a}=\left( \sum_{k=0}^{\infty}\mathbf{ CA}^k\frac{t^k}{k!}\right)\mathbf{a}=\mathbf{ 0}
使得 \mathbf{ y}(t)=\mathbf{ 0} 的初值在上述情况中只有两种可能,初值 \mathbf{ x}_0=\mathbf{ 0} 以及 \mathbf{ x}_0=\mathbf{ a}\ne\mathbf{ 0} ,这显然有悖于定义4.2,为了保证定义完整,系统能观性的必要条件就一定是 不存在这样的非零向量 \mathbf{ a}\ne\mathbf{ 0} ,它同时正交于所有向量 \mathbf{ CA}^k 。
就如同定理4.1所述,仅需考察 \mathbf{ A}^0,\mathbf{ A}^1,...,\mathbf{ A}^{n-1} ,因为更高次幂的 \mathbf{A}^{n},\mathbf{A}^{n+1},... 都可以通过前面低次幂的线性组合得到,于是有
(4.20) \mathbf{ CA}^k\mathbf{a}=\mathbf{ 0},\quad\quad k=0,1,...,n-1 或者说 \begin{bmatrix} \mathbf{ C}\\\mathbf{CA}\\ \vdots\\\mathbf{CA}^{n-1} \end{bmatrix}\mathbf{a}=\mathbf{ 0}
当式(4.20)里面这个矩阵秩为 n 时,即满秩,就可以保证不存在一个非零向量 \mathbf{ a}\ne\mathbf{ 0} 的非平凡解。这也是确定系统能观性的必要条件。
定理4.5 Kalman的能观性判据
式(4.15)所确定的系统是完全能观的,当且仅当能观矩阵 \mathbf{ Q}_B 满秩
(4.21) \mathbf{ Q}_B=\begin{bmatrix} \mathbf{ C}\\\mathbf{CA}\\ \vdots\\\mathbf{CA}^{n-1} \end{bmatrix} 或者SISO系统中 (4.22) \mathbf{ Q}_B=\begin{bmatrix} \mathbf{ c^T}\\\mathbf{ c^TA}\\ \vdots\\\mathbf{ c^TA}^{n-1} \end{bmatrix}
Rank(\mathbf{ Q}_B)=n
4.2.2 Hautus定义的能观性
除了Kalman给出的定义,还有Hautus的能观性定义,这也关于动态矩阵的特征值的分析
定理4.6 Hautus的能控性判据
式(4.1)所指的系统完全能控,当且仅当所有动态矩阵的特征值 \lambda_i 都满足
(4.23) Rank(\begin{bmatrix} \lambda_i \mathbf{ I-A}\\\mathbf{C} \end{bmatrix})=n
Kalman判据要探讨一个 (p\times n)\times n 的矩阵的秩。跟Kalman的判据不同,Hautus只需要讨论一个 (n+ p)\times n 的矩阵的秩。而且Hautus判据还可以直接给出哪一个特征值是不可控的!这样Hautus判据可以在一些计算中比Kalman判据更简单。
Hautus判据也可以用来判断系统是否有 能检测性 (Detektierbarkeit),系统是能检测的,当且仅当所有不稳定的特征值 Re(\lambda_i)\geq 0 都完全能观。
4.2.3 SISO系统变形为能观标准型
类比前面4.1.3中出现的能控标准型,我们也可以把系统变为能观标准型。引入变换矩阵 \mathbf{V} ,有变换关系 \mathbf{x}=\mathbf{V\tilde x} ,所以新坐标下有
(4.24) \begin{align} \mathbf{\dot {\tilde x}}&=\underbrace{\begin{bmatrix} 0&\cdots&\cdots&0&-a_0\\ 1&0&\cdots&0&-a_1\\ \vdots&1&\ddots&\vdots&\vdots&\\ 0&0&\ddots&0&-a_{n-2}\\ 0&0&\cdots&1&-a_{n-1} \end{bmatrix}}_{\mathbf{\tilde A}=\mathbf{V^{-1}AV}}\mathbf{ {\tilde x}}+\underbrace{\begin{bmatrix} b_0-a_0b_n\\ b_1-a_1b_n\\ \vdots\\ b_{n-2}-a_{n-2}b_n\\ b_{n-1}-b_{n-1}b_n \end{bmatrix}}_{\mathbf{\tilde b}=\mathbf{V^{-1} b}}u\\ y&=\begin{bmatrix}0&0&\cdots&0&1\\ \end{bmatrix}\mathbf{ {\tilde x}}+b_nu \end{align}
定理4.7 能观标准型的变换
如果式(4.9)决定的线性系统完全能观,那么才可以通过以下变换关系得到能观标准型
(4.25) \mathbf{V}=\begin{bmatrix} \mathbf{ v}&\mathbf{Av}& \cdots&\mathbf{A}^{n-1}\mathbf{v} \end{bmatrix},\quad \mathbf{ v}=\mathbf{ Q}_B^{-1}\begin{bmatrix} 0\\ \vdots\\0\\1 \end{bmatrix}, \quad \mathbf{ Q}_B=\begin{bmatrix} \mathbf{ c^T}\\\mathbf{ c^TA}\\ \vdots\\\mathbf{ c^TA}^{n-1} \end{bmatrix}
变换向量 \mathbf{ v} 为能观矩阵逆矩阵的最后一列。
类似能控标准型,能观标准型也是对于设计观测器来说特别合适的形式,而且输出量 y 只跟状态变量的最后一行有关。MIMO的能观标准型会在之后的篇章给出。
4.3 对偶原则
在上一章末尾已经展示过,标量传递函数转置与否不影响它的值,即
(4.26) G(s)=(G(s))^T=\left( \mathbf{c^T}(s\mathbf{I-A})^{-1}\mathbf{b}+d \right)^T=\mathbf{b^T}(s\mathbf{I-A^T})^{-1}\mathbf{c}+d
在MIMO系统里,更可以定义对偶关系
(4.27) \begin{align} \mathbf{\dot x}&=\mathbf{Ax+Bu}\qquad\\ \mathbf{y}&=\mathbf{Cx+Du} \end{align} \Leftrightarrow\\ \begin{align} \qquad \mathbf{\dot x}_D&=\mathbf{A^T}\mathbf{x}_D\mathbf{+C^Tu}_D\\ \mathbf{y}_D&=\mathbf{B^Tx}_D\mathbf{+D^Tu}_D \end{align}
对于传递矩阵来说 \mathbf{G}_D(s)=\mathbf{G^T}(s)
(4.28) \mathbf{G^T}(s)=\left( \mathbf{C}(s\mathbf{I-A})^{-1}\mathbf{B+D} \right)^T= \mathbf{B^T}(s\mathbf{I-A^T})^{-1}\mathbf{C^T+D^T}=\mathbf{G}_D(s)
此外还有对应的关系,原系统的能控性(能观性)恰好就是对偶系统的能观性(能控性)
(4.29) \mathbf{ Q^T}_S=\mathbf{ Q}_{B,D},\qquad \mathbf{ Q^T}_B=\mathbf{ Q}_{S,D}
定理4.8 对偶系统的能控能观性
对偶系统恰好能控(能观),当且仅当原系统能观(能控)。
到目前为止,状态方程描述的系统特性已经基本上讲完了。下一章我们正式开始已经前面铺垫的内容利用状态方程来设计控制器。
下一章传送门:
参考文献:
[1]Regelungstechnik B (Zustandsraummethoden) (WS 2019), Prof. Dr.-Ing. Knut Graichen
Lehrstuhl für Regelungstechnik, Friedrich-Alexander-Universität Erlangen-Nürnberg