1. 引言
近年来,多智能体系统的协调控制发展的越来越快,应用也越来越广泛,比如无人机、编队控制、群集、同步等等,引起了专家学者的广泛关注和深入研究。在多智能体系统的协调控制问题中,多智能体一致性问题是智能体之间协调控制的基础。Vicsek,A.Jadbabaie,Olfati-Saber,Murry和Ren等人 [1] [2] [3] [4] [5] 分别对一致性展开了研究,做出了理论分析。
上述的文献主要研究的是固定拓扑下的多智能体系统一致性问题,但是在实际问题中,我们经常会遇到很多随机因素的影响,许多系统的操作环境会带有不确定性,导致其通信拓扑结构可能会是随机切换的。在Olfati-Saber和Murry研究一致性问题的影响下,Costa在文献 [6] 中对带有干扰的连续时间马尔科夫切换下的多智能体系统进行了分析,并使其达到均方一致。对于离散时间下的多智能体系统,Zhang和Mo [7] [8] 也研究了马尔科夫切换拓扑下的均方一致性问题。Li等人 [9] 分别对离散和连续时间随机切换下的高阶多智能体系统的一致性问题展开了研究。Miao等人 [10] 研究了带有领航者的马尔科夫切换拓扑下的均方一致性问题。文献 [11] 基于采样控制研究了马尔科夫切换拓扑下二阶多智能体系统的均方一致性问题。
在上述文献中的多智能体系统的动力学为一阶、二阶或高阶的,但在实际生活中,一般的物理系统都是非线性的,因此对非线性系统的研究有着重大的意义。文献 [12] 研究了有向拓扑结构下的具有非线性系统模型的多智能体系统的同步问题,提出了有向拓扑有生成树可以使多智能体系统达到一致。 [13] 提出对二阶非线性多智能体系统,其系统可以达到一致。 [14] 提出了分布式非线性控制协议使多智能体系统达到一致。 [15] 讨论了有向网络下非线性多智能体系统的协调跟踪问题。
注意到已有的非线性多智能体系统一致性结果其网络拓扑图一般是固定的,往往忽略了其操作环境带来的不确定因素,使得文章的可行性不是很强。目前的文献主要是对于多智能体系统在随机切换下的一致性问题和非线性多智能体系统一致性问题分别给出的,但是同时考虑了随机切换拓扑和非线性多智能体系统下的文章并不多。本文研究了其均方一致性问题,首先假设其拓扑结构受到一个遍历的马氏链驱动,然后运用黎卡迪方程方法和随机系统理论,给出了实现均方一致的条件。
2. 问题描述
2.1. 图论基础
代数图论在多智能体系统中起着关键重要的作用,个智能体间的信息交互网络拓扑图记为,其中顶点的集合表示有个智能体,是图的边集。的边表示智能体和智能体之间可以发生信息的交互。图的邻接矩阵,其中表示节点和之间的连接权重,当节点能从节点得到其信息时,否则。图的拉普拉斯矩阵定义为,其中度矩阵是对角元为,其它元为零的对角矩阵。即有,。对于无向图,其的拉普拉斯矩阵为一个对称矩阵。本文中我们用用顶点0表示领航者,信息在领航者和包含在领航者邻居集内的智能体之间交互,其拓扑图由图表示,并且图由图、领航者0以及领航者与其邻居之间的边组成。
考虑个图的并图:
设分别是的邻接矩阵和拉普拉斯矩阵,若的邻接矩阵,则是的一个有效拉普拉斯矩阵。设,其中是第个图中第个智能体与领航者之间的权值,若智能体与领航者互为邻居,否则。矩阵,若对所有,,则称矩阵是对角占优的。设,由是对角占优矩阵,可知也是对角占优矩阵。由
可知也是对角占优矩阵。
在个不同的拓扑上随机切换,当且仅当随机变量。切换过程取决于时间齐次马尔科夫过程,这个马尔科夫过程的状态空间相当于所有可能的拓扑。
2.2. 系统模型
考虑包含N个智能体和一个领航者的多智能体系统,智能体i和领航者的系统方程如下所示:
(2.1)
(2.2)
其中常数矩阵表示为状态输入矩阵,表示控制输入矩阵,表示智能体在时刻的状态,表示领航者的状态,表示为控制输入,,是一个连续的向量值函数,它表示网络中各个体的固有非线性动态。
在随机切换拓扑上,根据多智能体系统(2.1)~(2.2)的领航者跟随一致性问题,我们设计如下一致性协议为:
(2.3)
其中是控制增益。
定义1:对任意的和的初始分布,若存在一致增益使得:
(2.4)
则称多智能体系统(2.1)~(2.2)在协议(2.3)下达到领航者跟随一致。
若存在正数和使得:
则称以速度达到连续时间领航者跟随一致。
引理2.1 [16] :若连通,则是一个正定矩阵。
假设2.1:图连通。
在假设2.1的条件下是一个正定矩阵,则的所有特征值大于0,设的最小特征值为,最大特征值为,且存在正交矩阵,使得,其中是矩阵的特征值,。
引理2.4 [17] :非线性函数满足如下Lipschitz条件:
(2.5)
其中;为正常数;为Euclidean范数。
引理2.5 [18] :任意两个向量和任意的正定对称矩阵,有
(2.6)
假设2.2:连续时间马尔科夫过程具有遍历性。
在假设3.1成立的条件下,马尔科夫过程容许唯一的不变分布,且马尔科夫过程中的任一状态可以从状态空间中的任何其他状态达到。其中。不失一般性,对所有的,马尔科夫过程的分布由给出。
假设2.3:镇定。
若可镇定,则如下黎卡迪(Riccati)方程存在正定解使得
可找到使得
(2.7)
若连通,增益矩阵设计为 [19]
其中系数。
假设2.4:存在一个使得:
(2.8)
成立,其中。
3. 主要结论
这部分研究多智能体系统(2.1)~(2.2)在协议(2.3)下的领航者跟随一致性问题。
定理3.1:考虑马尔科夫切换拓扑,假定假设2.1、假设2.2、假设2.3、假设2.4成立,设是(3.1)的解,。则对任意的初始条件,在控制协议(2.3)下,多智能体系统(2.1)~(2.2)可以速度达到了领航者跟随一致。
证明:智能体和领航者之间的状态误差表示为,的动态为
其中当时,,当时,。设
是时刻的拉普拉斯矩阵,由此可得:
(3.3)
其中。
考虑如下函数,我们设
通过 [20] 中的引理4.2得
可知
又由引理1.4和引理1.5可知
设,的分布由给出,可得
又由假设3.2、假设3.3可知
可得,即,以速度收敛到0,则在控制协议(2.3)下多智能体系统(2.1)~(2.2)可以以速度达到领航者跟随一致。
注3.1:文章 [9] 证明了在连续系统切换拓扑是联合连通的情况下,系统会实现均方一致性。本文在该基础上,以黎卡迪方程方法和随机系统理论方法,构造V函数,给出了实现均方一致的数值条件,具有很大的实际意义,而且考虑的系统模型是非线性的,得到的结果也具有工程意义。
4. 数值仿真
这部分给出例子来证明上述理论的有效性。考虑如图1所示的网络拓扑图,通信拓扑在,,之间随机切换,图里,,所有边的权值都为1,并图边的权值是,,对应边的权值之和。
考虑包含一个领航者和四个智能体的多智能体系统,如图1,通信拓扑在,,之间随机切换,假定系数矩阵
,
容易验证出是可镇定的。由图1可知,,是不连通的,是连通的。
我们可以得出
,,
继而
可得。设连续马尔科夫过程的初始分布,假定我们以速度达到领航者跟随一致。当,时,由(3.1)可得
由,取,可得
令,在控制协议(1.3)下,状态误差轨迹如图2和图3所示,可知4个智能体全部与
Figure 1. The network topology,,
图1. 网络拓扑图:,,
Figure 2. xi(1) agent state trajectory
图2. xi(1)智能体的状态轨迹
Figure 3. xi(2) agent state trajectory
图3. xi(2)智能体的状态轨迹
领航者达到一致。
5. 结论
本文主要研究了连续时间随机切换拓扑情况下的领航者跟随一致性问题,在拓扑图的并图连通的情况下,设计了基于多智能体之间信息的控制协议,利用黎卡迪(Riccati)方程、马尔科夫理论分析得到了领航者跟随的均方一致性,最后通过Matlab仿真验证了结果的正确性。
参考文献