1. 引言
马尔科夫跳跃系统是一类常见的随机系统,它常用于描述存在突变因素的系统,例如金融经济、管理科学、飞机控制等。而对于随机系统的一个热点研究方向是控制器的设定,而H∞控制理论是控制理论中重要的鲁棒控制设计方法,因为它的工程应用是为了去消除独立外部输入扰动
的影响,所以它能保证控制系统的稳定性。目前针对马尔科夫跳跃系统的H∞控制的成果有很多,文献 [1] 研究了离散时间广义马尔可夫跳跃系统的随机稳定性和鲁棒控制,文献 [2] 研究了一类具有时变时滞不确定马尔可夫跳变线性系统的鲁棒输出反馈H∞控制。文献 [3] 研究了周期马尔科夫跳变系统的H∞滤波问题;文献 [4] 研究了一类离散时间马尔可夫跳变系统在状态和控制变量约束下的二次型最优控制问题。文献 [5] [6] 研究了一类具有随机突变和未知的转移概率,但在每种模式的已知界限之间变化的离散时间线性系统,重新讨论了这类系统的H∞控制问题。
带马尔科夫和乘性噪声的随机系统是一类特殊的随机系统,近些年针对它的研究也有很多,文献 [7] 讨论了在方差约束下带马尔科夫和乘性噪声的随机系统的鲁棒控制问题,给出了具有方差约束的鲁棒控制器设计方法。文献 [8] 研究了一个具有白噪声扰动和马尔可夫跳变的随机系统的N个参和者的最优控制问题。文献 [9] 针对某些系统在一定的采样间隔内转移概率不变或者变化缓慢的情况,提出了分段带乘性噪声的齐次离散时间Markov跳跃系统模型,并研究了系统H∞估计问题。文献 [10] 研究了具有乘性噪声和马尔可夫链的部分观测值的马尔可夫跳跃线性系统的控制问题。文献 [11] 针对一类带乘性噪声的离散时间不确定奇异随机马尔可夫跳跃系统,研究了异步输出H∞反馈控制问题。
上述文献主要讨论的是有限时域或者有限状态的Markov跳跃系统的H∞控制问题。而文献 [12] 研究了一类具有无限马尔可夫跳变和乘性噪声的离散时滞随机系统的控制问题。文献 [13] [14] 中提出了一个随机版本的有界实引理。受上述文献的启发,本文将文献 [13] 的有界实引理推广到具有无限马尔可夫跳变参数和乘性噪声的无限时域离散时间时变系统,然后应用到H∞控制问题。
本文主要研究了在状态反馈控制器设计情况下探寻闭环系统的稳定性和H∞控制问题,得到了代数黎卡提方程稳定解与系统内部稳定性、线性矩阵不等式之间的等价性。首先介绍了所考虑系统的一些预备知识,比如系统的指数均方稳定性、扰动算子的定义以及舒尔补引理。然后利用舒尔补引理得到线性矩阵不等式、黎卡提方程稳定解的等价性、系统内部均方稳定性之间的等价性。
2. 预备知识与模型描述
本小节首先给出常用符号说明;其次简单介绍马尔可夫链相关的定义和随机系统中常用的稳定性定理;最后提供主要的数学引理。
本文中,
表示n维欧氏空间;
表示
实矩阵线性空间,
表示
欧氏范数或者
算子范数,
表示n阶对称矩阵;
表示矩阵(向量) A的转置,
表示A是正定(半正定);记
,
表示n阶恒等矩阵,
,
,
;
等价于
,
等价于
,特别的
,
表示对称项;
表示一致正,
表示由A生成的最小
代数,
表示样本空间,
表示事件发生的概率,
表示给定事件B情形下事件A发生的条件概率,
表示事件A发生的数学期望,
表示关于事件A发生的条件期望。
在给定完备概率空间
中,考虑带有无限马尔可夫跳参数、乘性噪声和独立外部输入扰动的离散随机系统如下:
(1)
分别表示系统状态、外部控制、外部扰动输入、控制输出。
都是具有合适维数的实矩阵序列。
是互相独立的随机向量序列,也称为乘性噪声
,
。
令
,当
时,有
。
和
相互独立。
是取值于可列可数集S中的马尔可夫链,其切换依赖于一个平稳非退化转移概率矩阵:
(2)
且具有性质:
(3)
记
表示
值随机过程
满足
可测和
的空间,故
是实Hilbert空间,其范数由通常的内积诱导:
.
记
表示集合
这其中
,很容易得到
是具有范数
的Banach空间;同理定义Banach空间
,其范数
。
当
,
可简记为
。若
,
,
,用
代替
。对
,
表示对所有
,且具有性质
。假设所考虑系统(1)中所有的参数矩阵都具有有限范数
,
。此外
表示从
到
的所有有界线性算子组成的线性空间。
,它的诱导范数用
表示。
在后续的研究中,为了公式记法的简便,对
我们将运用如下标记:
(4)
经过直接的计算验证了其中
。
首先对于系统(1)的状态控制律定义为:
。即上述所考虑的随机系统(1)可改写成如下闭环系统(5):
(5)
为了书写的方便,随机系统(5)可变形为:
(6)
其中
,
,
利用线性系统理论,对闭环系统(5)的解有分解如:
,
是闭环系统(5)关于初值问题
的唯一解。
这里
是以下零输入系统的唯一解,
(7)
类似的,
是以下零初值系统的唯一解,
(8)
下面是一些关于无限马尔可夫跳系统的基本概念。
定义1 [13] :如果对任意初值
,都有
,则称闭环系统(6)是内部均
方稳定,或系统(7)是指数均方稳定(EMSS)。
定义2 [13] :当系统(6)是指数均方稳定(EMSS)时,定义一个关于系统(6)输入输出扰动线性算子
形如:
(9)
其中
,当
时,意味着所考虑系统(6)没有外部输入扰动,相应的问题也无研究意义;当
时,进一步引诱出一个算子范数:
(10)
给定
,类似的定义另一个算子范数:
(11)
假设系统(1)中
,即得到系统(12)如下:
(12)
定义3 [15] :如果存在
,使得对所有
,都有
,则称
是一致正,
。
引理1 [16] (舒尔补引理):给定
,
,
。并且
则下面性质等价。
1)
;
2)
,并且
;
3)
,并且
。
引理2 [13] :让
(13)
是定义在
上的二次型。如果
是可逆矩阵,则对所有的
我们有:
(14)
3. 主要结果
在给出定理1之前,利用式子(4),基于系统(5)、(6)我们先给出如下标记:
(15)
(16)
离散时间随机系统(1)中的控制律定义为
定理1:给定
,下面性质等价
1) 闭环系统(5)内部均方稳定,。
2) 下面代数黎卡提方程有一个稳定解
(17)
3) 这存在一个
对所有的
满足如下线性矩阵不等式(LMI):
(18)
证明:
1)
2):
已知闭环系统(5)的内部是EMSS,并且
。通过文献 [13] 性质8.5,可以推得存在
满足下面差分方程(19):
(19)
接下来只需要证明满足差分方程(19)解的稳定性。给定
,定义线性扰动算子如式子(20):
(20)
是系统(6)的零初值解,其中
,
。基于输入输出算子
的定义,可以推导出对任意充分小的
,有
。
同理,存在
满足如下代数黎卡提方程
(21)
利用引理2,通过直接的计算,可以得出存在
使得代数黎卡提方程(17)可以改写成如下方程(22):
(22)
其中
。此时,不妨令
,则方程(22)可以推得以下方程(23)
(23)
类似的,方程(21)可以写成方程(24)如下所示:
(24)
其中
。联系式子(5)、方程(23)和(24)得到如下等式:
(25)
这里
由上诉证明知
,故
;通过文献 [17] 定理3.2可以推得对所有的
,都有
,由文献 [18] 定理3.2相对应的算子
生成指数稳定演化,闭环系统(5)的零解是指数均方稳定EMSS,则对应的代数黎卡提方程(17)的解是稳定解,故2)得证。
接着来证明2)
1):
假设代数黎卡提方程(17)稳定解为
,相对应有一个稳定反馈增益
。利用引理1的舒尔补技巧,代数黎卡提方程(17)可以等价于下面线性矩阵不等式(26)
(26)
即有
,这里
是常数,对线性矩阵不等式(26)中的1-1板块,结合式子(4),我们可以整理得到不等式(27)如下所示:
(27)
其中
是常数。由文献 [18] 定理5.4可知,系统(7)的零态平衡是指数均方稳定,故闭环系统(5)是内部均方稳定的。
接下来证明
。给定
,由性能指标函数以及引理2可以得到如下等式(28):
(28)
从上面已证明部分,可得闭环系统(5)是内部均方稳定,由文献 [12] ,当
时,
;故我们让
时,下式成立:
(29)
往证
利用反证法,即存在一个序列
使得
,并且
,则从(29)式得出:
(30)
其中
,
是闭环系统(5)关于外部扰动输入
和初值条件
的解,并且关于解
相对应的闭环系统(5)可以改写成如下等式(31):
(31)
由于
是稳定反馈增益,所以我们可以推得
,与此同时有:
显然,上式与
矛盾。因此
,即
,故1)成立。
最后来证明2)
3):
已知代数黎卡提方程(17)的稳定解为
,运用舒尔补技巧,我们可以得到对所有的
,代数黎卡提方程(17)等价于下面线性矩阵不等式LMI
(32)
其中
对上面线性矩阵不等式(32)左乘和右乘
得到如下不等式
(33)
其中令
,则对所有的
,从上面线性矩阵不等式(33)可以推得以下不等式
(34)
对于上面不等式中的
板块,利用舒尔补定理,我们可以得到上式等价于下面线性矩阵不等式(35):
(35)
不等式(35)左、右乘
,并且让
作为新的变量,则对所有的
,线性矩阵不等式(35)可以等价为线性矩阵不等式(18)。
故2)
3)证毕
综上所述定理1得以证明。
4. 结束语
近几年,关于随机系统有界实引理的研究被广泛应用于H∞控制问题中。本定理考虑的是在离散时间无限马尔可夫无限时域H∞控制问题,利用舒尔补技巧得到线性矩阵不等式、黎卡提方程稳定解的等价性、系统内部均方稳定性之间的等价性,即H∞控制问题和系统内部均方稳定性之间的等价性,为控制器的设计提供了新的方法。
基金项目
重庆理工大学研究生教育高质量发展行动计划资质成果,项目编号:gzlcx20223304,项目类型:校级联合资助项目。