1. 引言
实际生活中,多智能体系统在许多领域都有广泛的应用,例如在军事、生物以及电力系统等方面都有着重要的作用 [1] [2] [3]。其中,一致性问题作为多智能体相互协作的基础,一直受到大量研究者的重点关注。一致性是指多智能体系统中的个体在局部协作和相互通信下,调整自己的行为,最终使得每个个体均能达到相同的状态 [4]。而一致性问题也被广泛应用于机器人编队、集聚控制等方面 [5] [6],也是目前控制学科的一个研究重点。文献 [7] 研究了具有固定拓扑和切换拓扑的一阶线性多智能体系统一致性问题。文献 [8] 研究了带有领导者的线性多智能体系统的一致性问题。在上述文献中,大多只考虑了智能体之间仅存在合作关系,即最终所有智能体状态保持一致。
但是在实际场景中,智能体之间往往有合作关系也有对抗关系,比如自然界中两个物种之间的生存与对抗,竞技比赛中的对抗关系等。因此研究合作与对抗共存的网络拓扑更具有实际意义。合作与对抗的交互关系可以用正负权重的邻接矩阵表示,也就是可以用符号图表示,即所有智能体可以分为两组,这两组智能体最终收敛到大小相同但符号相反的一致性值。针对合作与对抗关系下的多智能体系统,文献 [9] 提出了二分一致性而不再是一致性,针对线性系统和非线性系统两种情况,研究了系统达到二分一致性的充要条件。文献 [10] 研究了基于结构平衡的符号网络的二分一致性问题,其结构平衡简单来说是指符号图中的节点集可以分为两个子集,每个子集内部节点之间的权重为正值,子集之间的节点连接处的权重为负值。文献 [11] 研究了非线性多智能体系统在符号有向图下的二分一致性问题。文献 [12] 研究了单领导者的线性系统的二分一致性问题。
对于一致性问题,传统的处理方法是对邻居信息进行周期采样,虽然此方法便于理论分析,但是却忽略了通信带宽和计算资源是有限的,因此采用传统方法会造成通信资源浪费这一问题。为了减少通信资源不必要的浪费,文献 [13] 提出了一种新的事件触发策略,基于事件触发控制协议的特点是:只有当一个特定事件发生即满足事件驱动函数时,才进行一次信息采样。因此采用事件触发的控制协议可以有效降低通信资源的消耗。现如今,众多学者在研究多智能体系统一致性问题中,已将事件触发策略有效应用。如文献 [14] 将事件触发策略应用到一阶多智能体系统一致性的研究当中。文献 [15] 研究了基于事件触发下的固定时间的多智能体系统一致性问题。文献 [16] 研究了基于事件触发下的二阶多智能体系统的一致性问题。文献 [17] 研究了基于事件触发下的领导跟随一致性问题。文献 [18] 研究了基于事件触发下的线性多智能体系统二分一致性问题。
本文在已有研究的基础上,考虑了有领导者非线性多智能体系统在符号有向图拓扑下以及事件驱动机制下的二分一致性跟踪控制问题。研究了集中式和分布式事件触发控制方法,利用矩阵理论、代数图论和Lyapunov稳定性理论得到了系统达到二分一致性跟踪控制的充分条件,同时验证了在两种控制协议下均不存在Zeno现象的发生。
符号标记:为便于本文数学推导,介绍以下数学符号定义和说明。
本文中R表示实数集合。设A为对称阵,
表示矩阵A的最小特征值,
表示A为正定矩阵,
。
2. 预备知识和问题描述
2.1. 图论
多智能体的通信拓扑可以用加权有向符号图
表示,其中
表示所有节点的集合,
表示所有边的集合,
表示符号图G所对应的加权邻接矩阵。对于符号有向图G,
表示一条从节点
到节点
的有向边,并且所对应的加权邻接矩阵A中元素
非零。
和
分别表示正边集合和负边集合,即
以及
,同时
。若在符号图中任意两个节点都存在一条有向路径,则称图G为强连通的。若智能体i和智能体j之间的信息交互是协作的,则
;若信息交互是对抗的,则
。在本文中将不考虑带有自环的符号图,即
。显然,在符号图G中,邻接矩阵A不再是非负矩阵。符号图G的度矩阵
,
。符号图G的Laplacian矩阵L定义为
。若G中所有边的权值全为正值,则称之为正符号图。
定义1 [4]:在符号图G中,若存在互不相交的节点集
和
,其中
,
,同时满足以下两个条件:
1)若
,则
;
2)若
,则
。
则称符号图G是结构平衡的,否则称结构不平衡。
引理1 [9]:当符号图是结构平衡的,则存在一个变换矩阵D,使得DAD为非负矩阵,其中
,
。
引理2 [19]:任意
,对于任意大于零的数
,则满足
。
2.2. 问题描述
本文中考虑由
个智能体所构成的系统,其中包括n个跟随者与一个领导者。跟随者的动力学方程可以描述为:
(1)
其中,
表示跟随者的状态,
表示控制输入,f表示非线性连续函数。
领导者的动力学方程可以描述为:
(2)
其中,
表示领导者的状态。
定义2:针对跟随者系统(1)与领导者系统(2),若存在控制输入
,使得对任意初始状态
与
,都满足以下条件:
则称控制输入
能解决二分一致性跟踪控制问题。
二分一致性跟踪控制意味着随着时间的推移,系统中的跟随智能体可分为两组,一组跟随智能体收敛到领导者的状态,另一组跟随智能体收敛到领导者状态的相反数。
3. 主要结果
3.1. 集中式事件触发二分一致性
本小节研究如下的控制协议:
(3)
其中,
表示控制增益,
表示智能体i的触发时刻,
的定义如下:
(4)
其中,
为符号函数。
定义智能体i的状态测量误差为:
(5)
在本文中,假设领导者只发送信息,则图G的Laplacian矩阵L可以写成分块的形式:
其中,
,
。
定义向量:
,
,
,
。
则式子(4)可以进一步表示为:
(6)
令
,
。
其中
。结合式子(6)可进一步表示为:
(7)
假设1:非线性函数
满足利普希兹条件:
其中,
,l为大于0的常数。
假设2:假设系统的通信拓扑G为结构平衡的且包含生成树,领导者为根节点。
引理3 [20]:在正符号图中,若G包含生成树,则矩阵
可逆且
。
引理4 [21]:若假设2成立,则
是非奇异M矩阵,且存在正定矩阵
,使得:
.
接下来给出本节的主要结论:
定理1:针对系统(1)与系统(2),智能体的事件触发函数可以设计为:
(8)
其中,
,控制增益
满足:
,
,P是引理4中的正定矩阵。
那么在控制协议(3)的作用下,系统(1)与系统(2)可以达到二分一致性跟踪控制。
证明:构造如下Lyapunov函数:
则
。
根据引理3,式(7)可以进一步表示为:
(9)
其中,
。结合系统(1)与系统(2)对
进行求导,可得:
(10)
所以
可进一步表示为:
所以根据引理4与假设1可将上式表示为:
(11)
由式(8)可以得到:
所以可以得到:
由条件可知,
,所以可以得到:
,从而使得系统(1)与系统(2)能够达到二分一致性跟踪控制。
定理2:针对跟随者系统(1)与领导者系统(2),若限定事件触发函数(8)成立,则在控制协议(3)作用下,智能体在任意两个连续事件触发时刻之间的间隔
不小于:
证明:由事件触发控制原理知,系统任意两个连续事件触发时刻之间的间隔时间为:
从0增长到
所需要的时间,记为
。
对
求导可得:
所以根据式(10)可进一步表示为:
(12)
根据控制增益
满足的范围,所以可得:
,且
。
所以根据式(12)可得:
(13)
令
,则有:
(14)
且z满足
,这里
是方程
,
的解。
由式(8)知方程的解满足:
求解方程可得:
所以定理得证。
3.2. 分布式事件触发二分一致性
本小节研究如下的控制协议:
(15)
其中,
表示控制增益,
表示智能体i的触发时刻,
的定义如下:
(16)
其中,
。
定义每个智能体的状态测量误差为:
(17)
则式(17)可以进一步表示为:
(18)
根据
,
,
。
则
可进一步表示为:
接下来给出本节的主要结论:
定理3:针对系统(1)与系统(2),智能体的事件触发函数可以设计为:
(19)
其中,
,
,控制增益
足:
,
,
,
为引理4中正定矩阵P的最大元素。
那么在控制协议(15)的作用下,系统(1)与系统(2)可以达到二分一致性跟踪控制。
证明:构造如下Lyapunov函数:
则
根据引理2可以得到:
因此可以对
进行放缩:
因为
,
所以可得:
所以根据式(19)可得:
所以可以得到:
(20)
由上可见,
,所以可以得到:
,从而使得系统(1)与系统(2)能够达到二分一致性跟踪控制。
定理4:针对跟随者系统(1)与领导者系统(2),若限定事件触发函数(19)成立,则在控制协议(15)作用下,至少存在一个智能体q,使得该智能体任意两个连续事件触发时刻之间的时间间隔
不小于:
证明:令
,
对于所有的智能体都满足,则有:
。通过证明定理2的证明过程以及式子(19)可以解出:
所以定理得证。
4. 数值仿真
考虑由5个智能体组成的非线性多智能体系统,其系统的通信拓扑结构设计如下:

Figure 1. Communication topology diagram
图1. 通信拓扑图
其中,节点0为领导者,节点1~4为跟随者。从图1可以看出领导者与智能1与智能体2之间为合作关系,智能体2与智能体3为对抗关系,智能体3和智能体4为合作关系,即:
,
。
根据该通信拓扑图,所以对应的Laplacian矩阵L为:
在系统中
,初始状态
,
,
,
。领导者
,初值为5。
在集中式事件触发机制(14)下,参数设置为:
,
,
。图2给出了系统(1)与系统(2)在该机制下的状态轨迹:

Figure 2. Results of binary consistency tracking control of multi-agent system triggered by centralized events
图2. 集中式事件触发的多智能体系统二分一致性跟踪控制结果
从图2中可以看出,在集中式事件触发机制下智能体之间达到了二分一致性跟踪目标,智能体1与智能体2收敛到与领导者相同的状态,智能体3与智能体4收敛到与领导者模相等,符号相反的状态。
在分布式事件触发机制(26)下,设置参数为:
,
,
,
,
,
。图3给出了系统(1)与系统(2)在该机制下的运动轨迹:

Figure 3. Results of binary consistency tracking control of multi-agent system triggered by distributed events
图3. 分布式事件触发的多智能体系统二分一致性跟踪控制结果
从图3中可以看出,在分布式事件触发机制下智能体之间达到了二分一致性跟踪目标,智能体1与智能体2收敛到与领导者相同的状态,智能体3与智能体4收敛到与领导者模相等,符号相反的状态。
5. 结论
本文研究了非线性多智能体系统的二分一致性跟踪控制问题,为解决传统时间采用控制造成的资源浪费问题,基于事件触发控制策略,设计了分布式和集中式控制协议。通过理论分析得出了所给的控制协议能够解决二分一致性跟踪控制问题。数值仿真结果验证了理论分析的正确性。
基金项目
重庆市自然科学基金(cstc2019jcyj-msxmX0491);重庆市教委科技项目青年项目(KJQN201901145)。
NOTES
*第一作者。
#通讯作者。