一类离散时间无限状态马尔可夫跳跃系统H∞控制

期刊菜单

一类离散时间无限状态马尔可夫跳跃系统H∞控制
H∞ Control for a Class of Discrete-Time Infinite State Markov Jump Systems

DOI: 10.12677/DSC.2023.123015, PDF, HTML, XML, 科研立项经费支持
作者: 何鑫, 严芳, 赵红霞, 贾亚琪, 张春梅：重庆理工大学理学院，重庆
关键词: 无限状态马尔可夫跳跃系统；黎卡提方程；离散时间；H∞控制；Infinite State Markov Jump System； Riccati Equation； Discrete Time； H∞ Control

摘要: 研究了一类具有同时受乘性噪声和无限马尔可夫跳参数影响的离散时间随机系统的控制问题。首先，给出了一个关于黎卡提方程解的线性不等式，通过求解线性不等式，构造了一个控制器，其次，利用算子理论和随机分析等知识给出离散时间随机系统的无限时域的有界实引理，并且通过一个耦合的黎卡提方程，证明了线性不等式的解和有界实引理之间的等价性。最后关于随机系统的一个线性反馈控制方案以黎卡提方程稳定解的线性矩阵不等式形式被提出，保证了随机控制系统的内部均方稳定性。

Abstract: The control problem of a class of discrete-time stochastic systems affected by multiplicative noise and infinite Markov jump parameters is studied. Firstly, a linear inequality about the solution of Riccati equation is given, and a controller is constructed by solving the linear inequality. Secondly, the bounded real lemma in infinite time domain of discrete-time stochastic systems is given by using the knowledge of operator theory and stochastic analysis. Through a coupled Riccati equation, the equivalence between the solution of linear inequality and bounded real lemma is proved. Finally, a linear feedback control scheme for stochastic systems is proposed in the form of linear matrix inequality of the stable solution of Riccati equation, which ensures the internal mean square stability of stochastic control systems.

文章引用：何鑫, 严芳, 赵红霞, 贾亚琪, 张春梅. 一类离散时间无限状态马尔可夫跳跃系统H∞控制[J]. 动力系统与控制, 2023, 12(3): 139-148. https://doi.org/10.12677/DSC.2023.123015

1. 引言

马尔科夫跳跃系统是一类常见的随机系统，它常用于描述存在突变因素的系统，例如金融经济、管理科学、飞机控制等。而对于随机系统的一个热点研究方向是控制器的设定，而H_∞控制理论是控制理论中重要的鲁棒控制设计方法，因为它的工程应用是为了去消除独立外部输入扰动 $v (t)$ 的影响，所以它能保证控制系统的稳定性。目前针对马尔科夫跳跃系统的H_∞控制的成果有很多，文献 [1] 研究了离散时间广义马尔可夫跳跃系统的随机稳定性和鲁棒控制，文献 [2] 研究了一类具有时变时滞不确定马尔可夫跳变线性系统的鲁棒输出反馈H_∞控制。文献 [3] 研究了周期马尔科夫跳变系统的H_∞滤波问题；文献 [4] 研究了一类离散时间马尔可夫跳变系统在状态和控制变量约束下的二次型最优控制问题。文献 [5] [6] 研究了一类具有随机突变和未知的转移概率，但在每种模式的已知界限之间变化的离散时间线性系统，重新讨论了这类系统的H_∞控制问题。

带马尔科夫和乘性噪声的随机系统是一类特殊的随机系统，近些年针对它的研究也有很多，文献 [7] 讨论了在方差约束下带马尔科夫和乘性噪声的随机系统的鲁棒控制问题，给出了具有方差约束的鲁棒控制器设计方法。文献 [8] 研究了一个具有白噪声扰动和马尔可夫跳变的随机系统的N个参和者的最优控制问题。文献 [9] 针对某些系统在一定的采样间隔内转移概率不变或者变化缓慢的情况，提出了分段带乘性噪声的齐次离散时间Markov跳跃系统模型，并研究了系统H_∞估计问题。文献 [10] 研究了具有乘性噪声和马尔可夫链的部分观测值的马尔可夫跳跃线性系统的控制问题。文献 [11] 针对一类带乘性噪声的离散时间不确定奇异随机马尔可夫跳跃系统，研究了异步输出H_∞反馈控制问题。

上述文献主要讨论的是有限时域或者有限状态的Markov跳跃系统的H_∞控制问题。而文献 [12] 研究了一类具有无限马尔可夫跳变和乘性噪声的离散时滞随机系统的控制问题。文献 [13] [14] 中提出了一个随机版本的有界实引理。受上述文献的启发，本文将文献 [13] 的有界实引理推广到具有无限马尔可夫跳变参数和乘性噪声的无限时域离散时间时变系统，然后应用到H_∞控制问题。

本文主要研究了在状态反馈控制器设计情况下探寻闭环系统的稳定性和H_∞控制问题，得到了代数黎卡提方程稳定解与系统内部稳定性、线性矩阵不等式之间的等价性。首先介绍了所考虑系统的一些预备知识，比如系统的指数均方稳定性、扰动算子的定义以及舒尔补引理。然后利用舒尔补引理得到线性矩阵不等式、黎卡提方程稳定解的等价性、系统内部均方稳定性之间的等价性。

2. 预备知识与模型描述

本小节首先给出常用符号说明；其次简单介绍马尔可夫链相关的定义和随机系统中常用的稳定性定理；最后提供主要的数学引理。

本文中， $R^{n}$ 表示n维欧氏空间； $R^{n \times m}$ 表示 $n \times m$ 实矩阵线性空间， $‖ \cdot ‖$ 表示 $R^{n}$ 欧氏范数或者 $R^{m \times n}$ 算子范数， $S_{n}$ 表示n阶对称矩阵； $A^{T}$ 表示矩阵(向量) A的转置， $A > 0 (A \geq 0)$ 表示A是正定(半正定)；记 $I = (I_{n}, I_{n}, \dots)$ ， $I_{n}$ 表示n阶恒等矩阵， $S = {1, 2, \dots}$ ， $D = {1, 2, \dots}$ ， $Z_{+} = {0, 1, 2, \dots}$ ； $A N *$ 等价于 $A N A^{T}$ ， $A *$ 等价于 $A A^{T}$ ，特别的

$(\begin{matrix} A & B \\ B^{T} & C \end{matrix}) = (\begin{matrix} A & B \\ * & C \end{matrix})$ ,

$*$ 表示对称项； $≫$ 表示一致正， $σ (A)$ 表示由A生成的最小 $σ$ 代数， $Ω$ 表示样本空间， $P (\cdot)$ 表示事件发生的概率， $P (A | B)$ 表示给定事件B情形下事件A发生的条件概率， $E [A]$ 表示事件A发生的数学期望， $E [\cdot | A]$ 表示关于事件A发生的条件期望。

在给定完备概率空间 $(Ω, H, P)$ 中，考虑带有无限马尔可夫跳参数、乘性噪声和独立外部输入扰动的离散随机系统如下：

$\begin{array}{l} x (t + 1) = [A_{0} (η_{t}) + \sum_{k = 1}^{r} A_{k} (η_{t}) ω_{k} (t)] x (t) + [B_{0} (η_{t}) + \sum_{k = 1}^{r} B_{k} (η_{t}) ω_{k} (t)] u (t) \\ + [M_{0} (η_{t}) + \sum_{k = 1}^{r} M_{k} (η_{t}) ω_{k} (t)] v (t) \\ z (t) = C (η_{t}) x (t) + D (η_{t}) u (t) + G (η_{t}) v (t) \end{array}$ (1)

$x (t) \in R^{n}, u (t) \in R^{n_{u}}, v (t) \in R^{n_{v}}, z (t) \in R^{n_{z}}$ 分别表示系统状态、外部控制、外部扰动输入、控制输出。 ${A_{k} (η_{t})}_{t}, {B_{k} (η_{t})}_{t}, {C (η_{t})}_{t}, {D (η_{t})}_{t}, {G (η_{t})}_{t}, {M_{k} (η_{t})}_{t}$ 都是具有合适维数的实矩阵序列。 $ω (t) = (ω_{1} (t), ω_{2} (t), \dots, ω_{r} (t))$ 是互相独立的随机向量序列，也称为乘性噪声 $E [ω (t) ω^{T} (t)] = I_{r}$ ， $E [ω (t)] = 0$ 。

令 $H_{t} = σ {η_{k}, ω_{s} | 0 \leq k \leq t, 0 \leq s \leq t - 1}$ ，当 $t = 0$ 时，有 $H_{0} = σ (η_{0})$ 。 ${η_{t}}_{t \in Z_{+}}$ 和 ${ω_{t}}_{t \in Z_{+}}$ 相互独立。 ${η_{t}}_{t \in Z_{+}}$ 是取值于可列可数集S中的马尔可夫链，其切换依赖于一个平稳非退化转移概率矩阵： $P = [p (i, j)]$

$p (i, j) = P {η_{t + 1} = j | η_{t} = i}, j \in S$ (2)

且具有性质：

${\begin{array}{l} p (i, j) \geq 0, \\ \sum_{j = 1}^{\infty} p (i, j) = 1. \end{array}$ (3)

记 $l^{2} (0, \infty; R^{m})$ 表示 $R^{m}$ 值随机过程 ${y (t, ω)}$ 满足 $H_{t}$ 可测和 $\sum_{t = 0}^{\infty} E ({‖ y_{t} ‖}^{2}) < \infty$ 的空间，故 $l^{2} (0, \infty; R^{m})$ 是实Hilbert空间，其范数由通常的内积诱导：

${‖ y ‖}_{l^{2} (0, \infty; R^{m})}^{2} = {(\sum_{t = 0}^{\infty} E ({‖ y_{t} ‖}^{2}))}^{1 / 2} < \infty$ .

记 $H_{1}^{m \times n}$ 表示集合 ${H | H = (H (1), H (2), \dots)}$ $H (i) \in R^{m \times n}$ 这其中 $\sum_{i = 1}^{\infty} ‖ H (i) ‖ < \infty$ ，很容易得到 $H_{1}^{m \times n}$ 是具有范数 ${‖ H ‖}_{1} = \sum_{i = 1}^{\infty} ‖ H (i) ‖$ 的Banach空间；同理定义Banach空间 $H_{\infty}^{m \times n}$ ，其范数 ${‖ H ‖}_{\infty} = \sup_{i \in S} ‖ H (i) ‖$ 。

当 $m = n$ ， $H_{1}^{n \times m} (H_{\infty}^{n \times m})$ 可简记为 $H_{1}^{n} (H_{\infty}^{n})$ 。若 $H (i) \in S_{n}$ ， $H (i) \geq 0$ ， $i \in S$ ，用 $H_{1}^{n +} (H_{\infty}^{n +})$ 代替 $H_{1}^{n} (H_{\infty}^{n})$ 。对 $X, Y \in H_{1}^{n +}$ ， $X \leq Y$ 表示对所有 $X (i) \leq Y (i)$ ，且具有性质 ${‖ X ‖}_{1} \leq {‖ Y ‖}_{1}$ 。假设所考虑系统(1)中所有的参数矩阵都具有有限范数 ${‖ \cdot ‖}_{\infty}$ ， ${‖ A ‖}_{\infty} = \sup_{i \in S} {‖ A ‖} < \infty$ 。此外 $B (X)$ 表示从 $X$ 到 $X$ 的所有有界线性算子组成的线性空间。 $Γ \in B (X)$ ，它的诱导范数用 ${‖ Γ ‖}_{X}$ 表示。

在后续的研究中，为了公式记法的简便，对 $\forall U \in H_{\infty}^{n}, F \in H_{\infty}^{m \times n}$ 我们将运用如下标记：

$\begin{array}{l} E_{i} (U) = \sum_{j = 1}^{\infty} p (i, j) U (j) \\ L_{i} (U) = \sum_{k = 0}^{r} A_{k} {(i)}^{T} E_{i} (U) A_{k} (i) \\ L_{i}^{F} (U) = \sum_{k = 0}^{r} {[A_{k K} (i) + M_{k} (i) F (i)]}^{T} E_{i} (U) [A_{k K} (i) + M_{k} (i) F (i)] \\ Π_{1}^{i} (U) = \sum_{k = 0}^{r} A_{k} {(i)}^{T} E_{i} (U) A_{k} (i) + C {(i)}^{T} C (i) \\ Π_{2}^{i} (U) = \sum_{k = 0}^{r} A_{k} {(i)}^{T} E_{i} (U) M_{k} (i) + C {(i)}^{T} G (i) \\ Π_{3}^{i} (U) = \sum_{k = 0}^{r} M_{k} {(i)}^{T} E_{i} (U) M_{k} (i) + G {(i)}^{T} G (i) - γ^{2} I_{n_{v}} \end{array}$ (4)

经过直接的计算验证了其中 $E, L \in B (H_{\infty}^{n +})$ 。

首先对于系统(1)的状态控制律定义为： $u (t) = Κ (η_{t}) x (t), K \in H_{\infty}^{n}$ 。即上述所考虑的随机系统(1)可改写成如下闭环系统(5)：

$\begin{array}{l} x (t + 1) = [(A_{0} (η_{t}) + B_{0} (η_{t}) K (η_{t})) + \sum_{k = 1}^{r} (A_{k} (η_{t}) + B_{k} (η_{t}) K (η_{t})) ω_{k} (t)] x (t) \\ + [M_{0} (η_{t}) + \sum_{k = 1}^{r} M_{k} (η_{t}) ω_{k} (t)] v (t) \\ z (t) = [C (η_{t}) + D (η_{t}) K (η_{t})] x (t) + G (η_{t}) v (t) \end{array}$ (5)

为了书写的方便，随机系统(5)可变形为：

$\begin{array}{l} x (t + 1) = [A_{0 K} (η_{t}) + \sum_{k = 1}^{r} A_{k K} (η_{t}) ω_{k} (t)] x (t) + [M_{0} (η_{t}) + \sum_{k = 1}^{r} M_{k} (η_{t}) ω_{k} (t)] v (t) \\ z (t) = C_{K} (η_{t}) x (t) + G (η_{t}) v (t) \end{array}$ (6)

其中

$A_{k K} (η_{t}) = A_{k} (η_{t}) + B_{k} (η_{t}) K (η_{t})$ , $C_{K} = C (η_{t}) + D (η_{t}) K (η_{t})$ ,

利用线性系统理论，对闭环系统(5)的解有分解如： $x (t) = x_{z i} (t) + x_{z s} (t)$ ， $x (t)$ 是闭环系统(5)关于初值问题 $x (0) = x_{0}$ 的唯一解。

这里 $x_{z i} = {x_{z i} (t), t \in Z_{+}}$ 是以下零输入系统的唯一解，

$\begin{array}{l} x_{z i} (t + 1) = [A_{0 K} (η_{t}) + \sum_{k = 1}^{r} A_{k K} (η_{t}) ω_{k} (t)] x_{z i} (t) \\ x_{z i} (0) = x_{0} \end{array}$ (7)

类似的， $x_{z s} = {x_{z s} (t), t \in Z_{+}}$ 是以下零初值系统的唯一解，

$\begin{array}{l} x_{z s} (t + 1) = [A_{0 K} (η_{t}) + \sum_{k = 1}^{r} A_{k K} (η_{t}) ω_{k} (t)] x_{z s} (t) + [M_{0} (η_{t}) + \sum_{k = 1}^{r} M_{k} (η_{t}) ω_{k} (t)] v (t) \\ x_{z s} (0) = 0 \end{array}$ (8)

下面是一些关于无限马尔可夫跳系统的基本概念。

定义1 [13] ：如果对任意初值 $(x_{0}, η_{0}) \in R^{n} \times S$ ，都有 $\lim_{t \to \infty} E [{‖ x_{z i} (t) ‖}^{2}] = 0$ ，则称闭环系统(6)是内部均

方稳定，或系统(7)是指数均方稳定(EMSS)。

定义2 [13] ：当系统(6)是指数均方稳定(EMSS)时，定义一个关于系统(6)输入输出扰动线性算子 $T : l^{2} (0, \infty; R^{n_{v}}) \to l^{2} (0, \infty; R^{n_{v}})$ 形如：

$T v (t) = C_{K} (η_{t}) x_{z s} (t) + G (η_{t}) v (t), t \in Z_{+}$ (9)

其中 $v \in l^{2} (0, \infty; R^{m})$ ，当 $v = 0$ 时，意味着所考虑系统(6)没有外部输入扰动，相应的问题也无研究意义；当 $v \neq 0$ 时，进一步引诱出一个算子范数：

$‖ T ‖ = \sup_{η_{0} \in S, x_{0} = 0} {\frac{‖ T v ‖}{‖ v ‖}; v \in l^{2} (0, \infty; R^{n_{v}}), ‖ v ‖ \neq 0}$ (10)

给定 $τ \in Z_{+}$ ，类似的定义另一个算子范数：

${‖ T ‖}_{τ} = \sup_{η_{0} \in S, x_{0} = 0} {\frac{{‖ T v ‖}_{τ}}{{‖ v ‖}_{τ}}; v \in l^{2} (0, \infty; R^{n_{v}}), {‖ v ‖}_{τ} \neq 0}$ (11)

假设系统(1)中 $u (t) \equiv 0, v (t) \equiv 0$ ，即得到系统(12)如下：

$\begin{array}{l} x (t + 1) = [A_{0} (η_{t}) + \sum_{k = 1}^{r} A_{k} (η_{t}) ω_{k} (t)] x (t) \\ z (t) = C (η_{t}) x (t) \end{array}$ (12)

定义3 [15] ：如果存在 $c > 0$ ，使得对所有 $k \geq 0$ ，都有 $f_{k} \geq c I$ ，则称 ${f_{k}}_{k \geq 0}$ 是一致正， $f_{k} ≫ 0$ 。

引理1 [16] (舒尔补引理)：给定 $U = (U (1), U (2), \dots) \in H_{\infty}^{n +}$ ， $V = (V (1), V (2), \dots) \in H_{\infty}^{n \times m}$ ， $W = (W (1), W (2), \dots) \in H_{\infty}^{m +}$ 。并且 $U^{T} = U, W^{T} = W$ 则下面性质等价。

1) $[\begin{matrix} U & V \\ * & W \end{matrix}] ≫ 0$ ；

2) $U ≫ 0$ ，并且 $W - V^{T} U^{- 1} V ≫ 0$ ；

3) $W ≫ 0$ ，并且 $U - V W^{- 1} V^{T} ≫ 0$ 。

引理2 [13] ：让

$Q (ξ, u) = {(\begin{array}{l} ξ \\ u \end{array})}^{T} (\begin{matrix} Q_{1} & Q_{2} \\ * & Q_{3} \end{matrix}) (\begin{array}{l} ξ \\ u \end{array})$ (13)

是定义在 $R^{n + m}$ 上的二次型。如果 $Q_{3}$ 是可逆矩阵，则对所有的 $ξ \in R^{n}, u \in R^{m}$ 我们有：

$Q (ξ, u) = ξ^{T} (Q_{1} - Q_{2} Q_{3}^{- 1} Q_{2}^{T}) ξ + {(u + Q_{3}^{- 1} Q_{2}^{T} ξ)}^{T} Q_{3} (u + Q_{3}^{- 1} Q_{2}^{T} ξ)$ (14)

3. 主要结果

在给出定理1之前，利用式子(4)，基于系统(5)、(6)我们先给出如下标记：

$Π_{1 K}^{i} (X) = \sum_{k = 0}^{r} A_{k K} {(i)}^{T} E_{i} (X) A_{k K} (i) + C_{K} {(i)}^{T} C_{K} (i)$ (15)

$Π_{2 K}^{i} (X) = \sum_{k = 0}^{r} A_{k K} {(i)}^{T} E_{i} (X) M_{k} (i) + C_{K} {(i)}^{T} G (i)$ (16)

离散时间随机系统(1)中的控制律定义为 $u (t) = K (η_{t}) x (t), K \in H_{\infty}^{n}$

定理1：给定 $γ > 0$ ，下面性质等价

1) 闭环系统(5)内部均方稳定，。

2) 下面代数黎卡提方程有一个稳定解 $X \in H_{\infty}^{n +}$

${\begin{cases} X (i) = Π_{1 K}^{i} (X) - Π_{2 K}^{i} (X) Π_{3}^{i} {(X)}^{- 1} Π_{2 K}^{i} {(X)}^{T} \\ Π_{3}^{i} (X) < - ε_{0} I, \forall ε_{0} \in (0, γ^{2} - {‖ T ‖}^{2}), i \in S \end{cases}$ (17)

3) 这存在一个 $Y \in S_{n}, Y > 0, W \in H_{\infty}^{n +}$ 对所有的 $i \in S$ 满足如下线性矩阵不等式(LMI)：

$[\begin{matrix} - Y & Y A_{0}^{T} (i) + W^{T} (i) B_{0}^{T} (i) & Y A_{1}^{T} (i) + W^{T} (i) B_{1}^{T} (i) & \dots & Y A_{r}^{T} (i) + W^{T} (i) B_{r}^{T} (i) & Y C^{T} (i) + W^{T} (i) D^{T} (i) \\ * & M_{0} (i) M_{0} {(i)}^{T} - Y & M_{0} (i) M_{1} {(i)}^{T} & \dots & M_{0} (i) M_{r} {(i)}^{T} & M_{0} (i) G {(i)}^{T} \\ * & * & M_{1} (i) M_{1} {(i)}^{T} - Y & \dots & M_{1} (i) M_{r} {(i)}^{T} & M_{1} (i) G {(i)}^{T} \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ \\ * & * & * & \dots & M_{r} (i) M_{r} {(i)}^{T} - Y & M_{r} (i) G {(i)}^{T} \\ * & * & * & * & * & G (i) G {(i)}^{T} - γ^{2} I_{n_{z}} \end{matrix}]$ (18)

证明：

1) $\Rightarrow$ 2)：

已知闭环系统(5)的内部是EMSS，并且 $‖ T ‖ < γ$ 。通过文献 [13] 性质8.5，可以推得存在 $X = (X (1), X (2), \dots) \in H_{\infty}^{n +}$ 满足下面差分方程(19)：

接下来只需要证明满足差分方程(19)解的稳定性。给定 $δ > 0$ ，定义线性扰动算子如式子(20)：

$T_{δ} v (t) = C_{K δ} (η_{t}) x_{z s} (t) + G_{δ} (η_{t}) v (t)$ (20)

$x_{z s} (t)$ 是系统(6)的零初值解，其中 $C_{K δ} (η_{t}) = {[C_{K} {(η_{t})}^{T}, δ I]}^{T}$ ， $G_{δ} (η_{t}) = {[G {(η_{t})}^{T}, 0]}^{T}$ 。基于输入输出算子 $T$ 的定义，可以推导出对任意充分小的 $δ > 0$ ，有 $‖ T_{δ} ‖ < λ$ 。

同理，存在 $X_{δ} = (X_{δ} (1), X_{δ} (2), \dots), X_{δ} (i) \geq 0, i \in S$ 满足如下代数黎卡提方程

${\begin{cases} X_{δ} (i) = Π_{1 K}^{i} (X_{δ}) + δ^{2} I - Π_{2 K}^{i} (X_{δ}) Π_{3}^{i} {(X_{δ})}^{- 1} Π_{2 K}^{i} {(X_{δ})}^{T} \\ Π_{3}^{i} (X_{δ}) < - ε_{0} I, \forall ε_{0} \in (0, γ^{2} - {‖ T_{δ} ‖}^{2}), i \in S \end{cases}$ (21)

利用引理2，通过直接的计算，可以得出存在 ${Γ (η_{t})} \in R^{n_{u} \times n}$ 使得代数黎卡提方程(17)可以改写成如下方程(22)：

$\begin{array}{l} X (i) = {(\begin{matrix} I \\ Γ (i) \end{matrix})}^{T} (\begin{matrix} \sum_{k = 0}^{r} A_{k K} {(i)}^{T} E_{i} (X) A_{k K} (i) & \sum_{k = 0}^{r} A_{k K} {(i)}^{T} E_{i} (X) M_{k} (i) \\ * & \sum_{k = 0}^{r} M_{k} {(i)}^{T} E_{i} (X) M_{k} (i) \end{matrix}) * \\ + {(\begin{matrix} I \\ Γ (i) \end{matrix})}^{T} (\begin{matrix} C_{K} {(i)}^{T} C_{K} (i) & C_{K} {(i)}^{T} G (i) \\ * & G {(i)}^{T} G (i) - γ^{2} I \end{matrix}) * \\ - {(Γ (i) - F (i))}^{T} (\sum_{k = 0}^{r} M_{k} {(i)}^{T} E_{i} (X) Μ_{k} (i) + G^{T} (i) G (i) - γ^{2} I) * \end{array}$ (22)

其中 $F (i) = - Π_{3}^{i} {(X)}^{- 1} Π_{2 K}^{i} {(X)}^{T}$ 。此时，不妨令 $Γ (i) = F (i)$ ，则方程(22)可以推得以下方程(23)

$X (i) = \sum_{k = 0}^{r} {[A_{k K} (i) + M_{k} (i) F (i)]}^{T} E_{i} (X) * + {(C_{K} (i) + F (i) G (i))}^{T} *$ (23)

类似的，方程(21)可以写成方程(24)如下所示：

$\begin{array}{l} X_{δ} (i) = \sum_{k = 0}^{r} {[A_{k K} (i) + M_{k} (i) F (i)]}^{T} E_{i} (X_{δ}) * + {(C_{K} (i) + F (i) G (i))}^{T} * + δ^{2} I \\ - {(F (i) - F^{δ} (i))}^{T} [\sum_{k = 0}^{r} M_{k} {(i)}^{T} E_{i} (X_{δ}) M_{k} (i) + G^{T} (i) G (i) - γ^{2} I] * \end{array}$ (24)

其中 $F^{δ} (i) = - Π_{3}^{i} {(X_{δ})}^{- 1} Π_{2 K}^{i} {(X_{δ})}^{T}$ 。联系式子(5)、方程(23)和(24)得到如下等式：

$X_{δ} (i) - X (i) = L_{i}^{F} (X_{δ} - X) + Δ (i)$ (25)

这里

$L_{i}^{F} (X) = \sum_{k = 0}^{r} {[A_{k K} (i) + M_{k} (i) F (i)]}^{T} E_{i} (X) *$

$Δ (i) = δ^{2} I - {[F_{i} (X) - F_{i}^{δ} (X)]}^{T} Π_{3}^{i} (X_{δ}) *$

由上诉证明知 $Π_{3}^{i} (X_{δ}) \leq - ε_{0} I$ ，故 $Δ (i) \geq δ^{2} I$ ；通过文献 [17] 定理3.2可以推得对所有的 $i \in S$ ，都有 $X_{δ} (i) \geq X (i)$ ，由文献 [18] 定理3.2相对应的算子 $L^{F}$ 生成指数稳定演化，闭环系统(5)的零解是指数均方稳定EMSS，则对应的代数黎卡提方程(17)的解是稳定解，故2)得证。

接着来证明2) $\Rightarrow$ 1)：

假设代数黎卡提方程(17)稳定解为 $X \in H_{\infty}^{n +}$ ，相对应有一个稳定反馈增益 $F (i) = - Π_{3}^{i} {(X)}^{- 1} Π_{2 K}^{i} {(X)}^{T}$ 。利用引理1的舒尔补技巧，代数黎卡提方程(17)可以等价于下面线性矩阵不等式(26)

$[\begin{matrix} Π_{1 K}^{i} (X) - X (i) & Π_{2 K}^{i} (X) \\ * & Π_{3}^{i} (X) \end{matrix}] \leq - μ I_{n + n_{v}}$ (26)

即有 $Π_{1 K}^{i} (X) - X (i) \leq - μ_{1} I_{n}$ ，这里 $μ > 0, μ_{1} > 0$ 是常数，对线性矩阵不等式(26)中的1-1板块，结合式子(4)，我们可以整理得到不等式(27)如下所示：

$\sum_{k = 0}^{r} A_{k K} {(i)}^{T} E_{i} (X) A_{k K} (i) - X (i) \leq - ς I_{n}$ (27)

其中 $ς > 0$ 是常数。由文献 [18] 定理5.4可知，系统(7)的零态平衡是指数均方稳定，故闭环系统(5)是内部均方稳定的。

接下来证明 $‖ T ‖ < γ$ 。给定 $τ \in Z_{+}$ ，由性能指标函数以及引理2可以得到如下等式(28)：

$\begin{matrix} J (0, τ, v) = \sum_{t = 0}^{τ} E [{‖ z (t) ‖}^{2} - γ^{2} {‖ v (t) ‖}^{2}] \\ = - E [x_{z s} {(τ + 1)}^{T} X (η_{τ + 1}) x_{z s} (τ + 1)] + \sum_{t = 0}^{τ} E [(\begin{matrix} x_{z s} (t) \\ v (t) \end{matrix}) [\begin{matrix} Π_{1 K}^{η_{t}} (X) - X (i) & Π_{2 K}^{η_{t}} (X) \\ * & Π_{3}^{η_{t}} (X) \end{matrix}] *] \\ = - E [x_{z s} {(τ + 1)}^{T} X (η_{τ + 1}) x_{z s} (τ + 1)] + \sum_{t = 0}^{τ} E [{(v (t) + Π_{3}^{η_{t}} {(X)}^{- 1} Π_{2 K}^{η_{t}} {(X)}^{T} x_{z s} (t))}^{T} Π_{3}^{η_{t}} (X) *] \end{matrix}$ (28)

从上面已证明部分，可得闭环系统(5)是内部均方稳定，由文献 [12] ，当 $v \in l^{2} (0, \infty; R^{n_{v}})$ 时， $x (t) \in l^{2} (0, \infty; R^{n})$ ；故我们让 $τ \to \infty$ 时，下式成立：

$\begin{matrix} J (0, \infty, v) = \sum_{t = 0}^{\infty} E [{(v (t) + Π_{3}^{i} {(X)}^{- 1} Π_{2 K}^{i} {(X)}^{T} x_{z s} (t))}^{T} Π_{3}^{i} (X) *] \\ = \sum_{t = 0}^{\infty} E [{(v (t) - F (i) x_{z s} (t))}^{T} Π_{3}^{i} (X) *] \leq 0 \end{matrix}$ (29)

往证 $\sup {J (0, \infty, v) < 0; v \in l^{2} (0, \infty; R^{n_{v}}), ‖ v ‖ = 1} < 0$

利用反证法，即存在一个序列 ${v_{j}}_{j \geq 1} \in$ 使得 $‖ v_{j} ‖ = 1$ ，并且 $\lim_{j \to \infty} J (0, \infty, v_{j}) = 0$ ，则从(29)式得出：

$\lim_{j \to \infty} E [\sum_{t = 0}^{\infty} {‖ f_{j} (t) ‖}^{2}] = 0$ (30)

其中 $f_{j} (t) = v_{j} (t) - F (i) x_{v_{j}} (t)$ ， $x_{v_{j}} (t)$ 是闭环系统(5)关于外部扰动输入 $v_{j} (t)$ 和初值条件 $x_{j} (0) = 0$ 的解，并且关于解 $x_{v_{j}} (t)$ 相对应的闭环系统(5)可以改写成如下等式(31)：

$\begin{array}{l} x_{v_{j}} (t + 1) = [(A_{0} (η_{t}) + B_{0} (η_{t}) K (η_{t}) + M_{0} (η_{t}) F (η_{t})) \begin{matrix} \end{matrix} \\ + \sum_{k = 1}^{r} (A_{k} (η_{t}) + B_{k} (η_{t}) K (η_{t}) + M_{k} (η_{t}) F (η_{t})) ω_{k} (t)] x_{v_{j}} (t) \\ + [M_{0} (η_{t}) + \sum_{k = 1}^{r} M_{k} (η_{t}) ω_{k} (t)] (v_{j} (t) - F (η_{t}) x_{v_{j}} (t)) \end{array}$ (31)

由于 $F (η_{t})$ 是稳定反馈增益，所以我们可以推得 $\lim_{j \to \infty} E [\sum_{t = 0}^{\infty} {‖ x_{v_{j}} (t) ‖}^{2}] = 0$ ，与此同时有： $\lim_{j \to \infty} E [{‖ v_{j} (t) ‖}^{2}] \leq 2 \lim_{j \to \infty} E [{‖ f_{η_{t}} (t) ‖}^{2}] + 2 \lim_{j \to \infty} E [‖ F (η_{t}) x_{v_{j}} (t) ‖] = 0$

显然，上式与 $‖ v_{j} ‖ = 1$ 矛盾。因此 $J (0, \infty, v) < 0$ ，即 ${‖ T ‖}_{\infty} < γ$ ，故1)成立。

最后来证明2) $\Rightarrow$ 3)：

已知代数黎卡提方程(17)的稳定解为 $X \in H_{\infty}^{n +}$ ，运用舒尔补技巧，我们可以得到对所有的 $i \in S$ ，代数黎卡提方程(17)等价于下面线性矩阵不等式LMI

$[\begin{matrix} - X & 0 & Φ_{1}^{i} (X) & C {(i)}^{T} + K {(i)}^{T} D {(i)}^{T} \\ * & - γ^{2} I & Φ_{2}^{i} (X) & G {(i)}^{T} \\ * & * & - X & 0 \\ * & * & * & - I \end{matrix}] < 0$ (32)

其中

$Φ_{1}^{i} (X) = [(A_{0} {(i)}^{T} + K {(i)}^{T} B_{0} {(i)}^{T}) X, \dots, (A_{r} {(i)}^{T} + K {(i)}^{T} B_{r} {(i)}^{T}) X]$

$Φ_{2}^{i} (X) = [M_{0} {(i)}^{T} X, \dots, M_{r} {(i)}^{T} X]$

$X = d i a g \underset{r + 1}{\underset{︸}{{X, X, \dots, X}}}$

对上面线性矩阵不等式(32)左乘和右乘 $d i a g {X^{- 1}, I, X^{- 1}, I}$ 得到如下不等式

$[\begin{matrix} - X^{- 1} & 0 & X^{- 1} Φ_{1}^{i} (X) X^{- 1} & X^{- 1} (C {(i)}^{T} + K {(i)}^{T} D {(i)}^{T}) \\ * & - γ^{2} I & Φ_{2}^{i} (X) X^{- 1} & G {(i)}^{T} \\ * & * & - X^{- 1} & 0 \\ * & * & * & - I \end{matrix}] < 0$ (33)

其中令 $Y = X^{- 1}, K (i) = W (i) Y^{- 1}$ ，则对所有的 $i \in S$ ，从上面线性矩阵不等式(33)可以推得以下不等式

$[\begin{matrix} - Y & 0 & Φ_{0} & \dots & Φ_{r} & Ξ \\ * & - γ^{2} I & M_{0}^{T} (i) & \dots & M_{r}^{T} (i) & G^{T} (i) \\ * & * & - Y & \dots & 0 & 0 \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ \\ * & * & * & \dots & - Y & 0 \\ * & * & * & \dots & * & - I \end{matrix}] < 0$ (34)

对于上面不等式中的 $- γ^{2} I$ 板块，利用舒尔补定理，我们可以得到上式等价于下面线性矩阵不等式(35)：

$[\begin{matrix} - Y & Φ_{0} & Φ_{1} & \dots & Φ_{r} & Ξ \\ * & Τ_{00} - Y & Τ_{01} & \dots & Τ_{0 r} & γ^{- 2} M_{0} (i) G {(i)}^{T} \\ * & * & Τ_{11} - Y & \dots & Τ_{1 r} & γ^{- 2} M_{1} (i) G {(i)}^{T} \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ \\ * & * & * & \dots & Τ_{r r} - Y & γ^{- 2} M_{r} (i) G {(i)}^{T} \\ * & * & * & \dots & * & γ^{- 2} G (i) G {(i)}^{T} - I_{n_{z}} \end{matrix}] < 0$ (35)

不等式(35)左、右乘 $d i a g \underset{r + 3}{\underset{︸}{{γ I, γ I, \dots, γ I}}}$ ，并且让 $γ^{2} Y$ 作为新的变量，则对所有的 $i \in S$ ，线性矩阵不等式(35)可以等价为线性矩阵不等式(18)。

故2) $\Leftrightarrow$ 3)证毕

综上所述定理1得以证明。

4. 结束语

近几年，关于随机系统有界实引理的研究被广泛应用于H_∞控制问题中。本定理考虑的是在离散时间无限马尔可夫无限时域H_∞控制问题，利用舒尔补技巧得到线性矩阵不等式、黎卡提方程稳定解的等价性、系统内部均方稳定性之间的等价性，即H_∞控制问题和系统内部均方稳定性之间的等价性，为控制器的设计提供了新的方法。

基金项目

重庆理工大学研究生教育高质量发展行动计划资质成果，项目编号：gzlcx20223304，项目类型：校级联合资助项目。

参考文献

[1]	Lam, J., Shu, Z., Xu, S.Y. and Boukas, E.-K. (2007) Robust H∞ Control of Descriptor Discrete-Time Markovian Jump Systems. International Journal of Control, 80, 374-385. https://doi.org/10.1080/00207170600999322
[2]	Kang, Y., Zhang, J.F. and Ge, S.S. (2008) Robust Output Feedback H∞ Control of Uncertain Markovian Jump Systems with Mode-Dependent Time-Delays. International Journal of Control, 81, 43-61. https://doi.org/10.1080/00207170701235766
[3]	Aberkane, S. and Dragan, V. (2012) H∞ Filtering of Periodic Markovian Jump Systems: Application to Filtering with Communication Constraints. Automatica, 48, 3151-3156. https://doi.org/10.1016/j.automatica.2012.08.040
[4]	Costa, O.L.V., Assumpção Filho, E.O., Boukas, E.K. and Marques, R.P. (1999) Constrained Quadratic Control of Markovian Jump Linear Systems. Automatica, 35, 617-626. https://doi.org/10.1016/S0005-1098(98)00202-7
[5]	Boukas, E.K. (2010) H∞ Control of Discrete-Time Markov Jump Systems with Bounded Transition Probabilities. Optimal Control Applications & Methods, 30, 477-494. https://doi.org/10.1002/oca.870
[6]	田恩刚, 岳东, 杨继全. 具有随机非线性和部分转移概率未知的马尔科夫系统的H∞控制[J]. 控制理论与应用, 2014, 31(3): 392-396.
[7]	Wang, Z., Yang, F., Ho, D. and Liu, X. (2007) Robust Variance-Constrained H∞ Control for Stochastic Systems with Multiplicative Noises. Journal of Mathematical Analysis & Applications, 328, 487-502. https://doi.org/10.1016/j.jmaa.2006.05.067
[8]	Kong, S.L. and Zhang, Z.S. (2012) Optimal Control of Stochastic System with Markovian Jumping and Multiplicative Noises. Acta Automatica Sinica, 38, 1113-1118. https://doi.org/10.1016/S1874-1029(11)60285-1
[9]	Zhang, L. (2009) H∞ Estimation for Discrete-Time Piecewise Homogeneous Markov Jump Linear Systems. Automatica, 45, 2570-2576. https://doi.org/10.1016/j.automatica.2009.07.004
[10]	Graciani, C.C., Todorov, M.G. and Fragoso, M.D. (2021) Fast Switching Detector-Based H2 Control of Markov Jump Linear Systems with Multiplicative Noises. SIAM Journal on Control and Optimization, 59, 4243-4267. https://doi.org/10.1137/20M1335303
[11]	Zhao, Y., Zhang, T. and Zhang, W. (2020) Asynchronous H∞ Control for Uncertain Singular Stochastic Markov Jump Systems with Multiplicative Noise Based on Hidden Markov Mode. Journal of the Franklin Institute, 357, 5226-5247. https://doi.org/10.1016/j.jfranklin.2020.02.043
[12]	Liu, Y. and Hou, T. (2018) Exponential Stability and Robust H∞ Control for Discrete-Time Time-Delay Infinite Markov Jump Systems. Discrete Dynamics in Nature and Society, 2018, Article ID: 3676083.
[13]	Dragan, V., Morozan, T., Stoica, M., et al. (2010) Mathematical Methodsin Robust Control of Discrete-Time Linear Stochastic Systems. Springer, New York. https://doi.org/10.1007/978-1-4419-0630-4
[14]	Hou, T., Jie, W. and Ma, H. (2016) Bounded Real Lemma for Discrete-Time Stochastic Systems with Infinite Markov Jumps. Proceedings of 2016 35th Chinese Control Conference (CCC), Chengdu, 27-29 July 2016, 1856-1861. https://doi.org/10.1109/ChiCC.2016.7553365
[15]	Morozan, T. and Dragan, V. (2018) Observability and Detectability of a Class of Discrete-Time Stochastic Linear Systems. IMA Journal of Mathematical Control & Information, 23, 371-394. https://doi.org/10.1093/imamci/dni064
[16]	Todorov, M.G. and Fragoso, M.D. (2009) Output Feedback H∞ Control of Continuous-Time Infinite Markovian Jump Linear Systems via LMI Methods. Proceedings of 49th IEEE Conference on Decision & Control, Atlanta, 15-17 December 2010, 6505-6510. https://doi.org/10.1109/CDC.2010.5717291
[17]	Liu, Y., Hou, T. and Bai, X. (2017) Infinite Horizon H2/H∞ Optimal Control for Discrete-Time Infinite Markov Jump Systems with (x, u, v)-Dependent Noise. Proceedings of 2017 36th Chinese Control Conference (CCC), Dalian, 26-28 July 2017.
[18]	Dragan, V. and Morozan, T. (2008) Discrete-Time Linear Equations Defined by Positive Operators on Ordered Hilbert Spaces. Revue Roumaine Des Mathematiques Pures Et Appliquees, 53, 131-166.

为你推荐

友情链接