1. 引言
近年来,随着移动通信技术和人工智能等相关领域的不断发展,多智能体系统协同控制的实用性日益凸显。得益于其在智能电网[1]、大规模机器学习[2]、医学研究[3]等各领域的广泛应用,分布式优化问题逐步成为多智能体系统分布式协同控制领域研究的热点之一。在该问题背景下,系统中的每个智能体拥有一个仅自身可知的局部目标函数,系统的全局目标函数为所有局部目标函数的和,分布式优化的目标是每个智能体通过与邻居智能体间的信息交互协同最小化全局目标函数[4]。不同于集中式,分布式的方法意味着每个智能体通过局部信息交互与迭代达成一致性,克服了集中式算法在复杂问题上的局限。文献[4]-[11]提出了多种算法以分析求解该分布式优化问题。文献[4]提出了一种针对离散时间多智能体系统的分布式子梯度方法,通过提出投影共识算法将文献[5]中的工作扩展到解决代理被限制在给定集合内的问题。文献[6]提出了考虑离散时间条件、局部约束集和通信延迟的分布式次梯度投影算法。文献[7]针对非均匀梯度增益、有限时间收敛性和凸约束集,提出了一类分布式连续时间算法来处理连续时间分布优化问题。为了扩大适用性,文献[8]-[11]提出了一些基于拉格朗日的分布式算法。此外,结合物理动力学,分布式优化问题得到了越来越广泛的重视,当控制方案最优时,每个智能体的行为也是最优的。文献[12]为一般线性多智能体系统建立了两种自适应分布式最优算法,以最小化性能函数实现一致性。
当解决复杂的非线性质点系系统的动力学问题时,EL系统经常被使用,故其具有较强的通用性和显著的研究价值[13][14]。同时,多EL系统的分布式优化问题也引起了各位研究者的关注。文献[15][16]针对多EL系统建立了几种分布式优化算法,但其控制参数的选择与全局信息有关,导致了这些设计的局限性。为了满足实际场景的需要,文献[3]提出了一种针对无向图的不确定EL系统的自适应分布式优化算法,实现了隐私保护和完全分布式的需要。文献[17]研究了不确定多EL系统的约束分布式优化问题。文献[18]设计了一种具有局部和相对测量值的分布式非线性控制器,以实现多EL系统的分布式优化结果。
目前为止的研究结果大多是在通信拓扑被建模为无向图或加权平衡有向图[15]-[17]的条件下提出的。但双向通信是一种十分理想的信息交互方式,每个智能体都需要同时获取入邻信息和出邻信息,在实际应用中往往难以实现。因此,在权重不平衡的有向网络上多EL系统的分布式优化问题仍有待解决。为解决该问题,本文提出了一种EL系统在权重不平衡有向图下的分布式优化算法。与文献[15]-[18]不同,本文考虑的智能体间的通讯结构为更一般的非平衡有向拓扑结构,系统的总入度和总出度无需相等,拓扑的不对称性增加了理论分析的复杂度;此外,文献[15]-[17]以解耦的方式解决分布式优化问题,实际应用中难以实现,为解决该问题,本文的算法采用更为复杂的耦合结构,增加了所提出算法的实用性。
基于上述论述,本文的主要结构如下:第一章给出符号、图论和凸函数等相关预备知识;第二章给出问题的表述;第三章给出EL系统在权重不平衡有向图下的分布式优化算法;第四章利用数值仿真验证所提出算法的有效性;第五章给出最后的结论。
2. 预备知识
2.1. 符号
在本文中,
表示一个全体实数集,
表示一个n维的实向量空间,
表示正实数空间。
表示
维实矩阵组成的集合。
表示向量的欧几里得范数和矩阵的诱导2-范数;
表示元素为1的n维列向量;
表示m维的单位阵;乘子
表示Kronecker积。
2.2. 图论
表示智能体之间互相传递信息的加权有向网络,其中,
表示智能体的集合;
表示有向边的集合;
表示加权的邻接矩阵。
表示从i到j的有向边,其表示智能体i向智能体j发送信息,但反之不然。
表示从j到i的有向边的权重。若
,则
,否则
。网络中的有向路径是由有向边连接的智能体序列。若任意智能体之间均有一条有向路径,则称
是强连通的有向网络。
定义
表示智能体i的入邻集。相应的,
表示智能体i的入度。有向网络
的拉普拉斯矩阵定义为
,其中,
;
,
。若网络中有
成立,则称
是权重不平衡的有向网络。
引理1[10]:权重不平衡的强连通有向网络
满足如下性质:
对于拉普拉斯矩阵L的0特征值,
,
,
是其对应的左特征向量,并且
满足
及
;
拉普拉斯矩阵L的0特征值对应的右特征向量为
;
定义
,则
是对应于权重平衡的强连通有向网络的拉普拉斯矩阵。令
,则有
。
2.3. 凸函数
对一个可微函数
,
表示其梯度。若对于
,
,有
成立,则称函数
是凸函数。若存在常数
,对于
,有
成立,则称函数
是
-强凸的。若存在常数
,对于
,
,则称函数
是
-Lipschitz的。若梯度
在一个连通的开集
上是局部Lipschitz的,则其在
处的Hessian广义矩阵为
。
以下的引理给出判断分布式优化问题是否达到最优的依据。
引理2[19]:若
是一个连续可微的凸函数,则
在
取最小值当且仅当
。
3. 问题描述
考虑有向网络
包含n个智能体。任一智能体
的动力学建模成如下欧拉–拉格朗日系统:
(1)
其中,
表示广义坐标;
表示广义坐标导数;
、
、
分别表示对称的惯性矩阵、科里奥利力向量和广义控制力向量。EL系统被广泛地用于机械臂系统、无人车、航天器等实际对象的建模。研究EL系统的分布式最优协同控制算法具有普遍的实际意义。EL系统满足如下经典性质:
是反对称矩阵;
存在常数
,
,
使得对于
,有
和
成立。
对于动力学建模为(1)的智能体,每个智能体拥有一个仅自己可得的局部目标函数
。对于非平衡有向网络中的多EL系统(1),分布式优化问题的目标为最小化如下所示的全局目标函数:
(2)
为了解决上述问题我们作出如下假设:
假设1:非平衡有向图
是强连通图。
假设2:任一局部目标函数
是可微且
-强凸的,其梯度
是满足全局Lipshitz性,Lipschitz系数为
。
注释1:上述两个假设为解决分布式优化问题(2)的经典假设,且由假设2可知,全局目标函数
是强凸的,这保证了分布式优化问题(2)解的唯一性。
4. 主要内容
为解决多EL系统(1)在权重非平衡有向图下的分布式优化问题(1),本文首先明确需为智能体设计恰当的广义控制力
,使得每个智能体收敛到分布式优化问题(1)的全局最优解,并达成一致性。为此,对于智能体
,本文给出如下所示的广义控制力:
(3)
其中
、
分别为取值范围待定的正参数,
为中间变量,用于估计全局最优解。进一步,对
,分布式优化算法及平衡补偿变量如下所示:
(4)
(5)
(6)
其中
、
、
分别为取值范围待定的正参数,
为智能体i的内部状态,
是第i个平衡补偿器,
是
的第j个分量,
。此外,
的初始状态需满足如下条件:
(7)
注释2:分布式优化问题(2)的全局最优解由引入的中间变量
估计。分布式优化算法(4)~(6)中,每个智能体在梯度
驱使下最小化其局部目标函数
,一致性项
保证不同智能体间的状态
达成一致,
平衡梯度项和一致性项的关系,保证智能体最终达成的一致性状态收敛到(2)的全局最优解上。同时,为处理非平衡有向图对分布式优化算法的影响,本文引入了平衡补偿变量
,对任意
,
的第i个元素将收敛到拉普拉斯矩阵L的0特征值对应左特征向量
的第i个分量上。
注释3:在广义控制力(3)的作用下,每个智能体的广义速度
将追踪上相对应的中间变量
。换言之,多EL系统(1)的分布式优化问题(2)等价于一个跟踪问题。此外,由分布式优化算法(4)~(6)可知,智能体利用自身真实信息估计全局最优解,即对全局最优解的估计与追踪同步进行,这样的效果使算法更具实际意义。
基于上述论述,本文主要定理如下:
定理1:当假设1、2、3成立时,给定初值
,分布式优化算法(3)~(6)会驱使多EL系统(1)的广义坐标渐近收敛到分布式优化问题(2)的全局最优解上。
证明:证明共分为四步,第一步证明平衡点最优,第二步给出中间变量
与分布式优化问题(2)的全局最优解的收敛性分析,第三步给出EL系统(1)的广义坐标导数与
的收敛性分析,第二步与第三步耦合,因此在第四步中给出整个系统的稳定性条件。首先给出分布式优化算法(4)~(6)平衡点与非平衡有向图下的分布式优化问题(2)全局最优解之间的关系。
第一步:由文献[10]可知,拉普拉斯矩阵L的0特征值对应的左特征向量
可以被平衡补偿器(6)估计,换言之,
,
。
令
,可将算法改写为:
(8)
(9)
(10)
对(9)两边左乘
,可得
,即
。设
为稳定点,系统稳定时
,故:
(11)
(12)
(13)
对(12)两边左乘
,可得:
(14)
对(14)两边同乘
,可得
,由于整个系统稳定时
,故
,又
为强连通图,故
,即分布式优化算法(4)~(6)的稳定点是问题(2)的全局最优解。
下一步,基于李雅普诺夫理论,给出分布式优化算法(4)~(6)对全局最优解的收敛性分析。
第二步:将算法(4)~(6)改写为如下的紧凑形式:
(15)
由于
,证明(15)的稳定性等价于分析如下系统的收敛性:
(16)
令
,
,可得:
(17)
其中,
。定义如下李雅普诺夫函数:
(18)
根据(18)可以得出
的导数为:
(19)
由假设2和杨氏不等式可得:
(20)
其中
,将(20)简写为:
(21)
其中
,
,
。
下一步,基于李雅普诺夫理论,给出智能体广义坐标导数与
间误差的稳定性分析。
第三步:定义如下李雅普诺夫函数:
(22)
根据(22)可以得出
的导数为:
(23)
由杨氏不等式可得:
(24)
由(3)式可以得出:
(25)
此外:
(26)
故由(26)可得:
(27)
其中
,此外:
(28)
故由(28)可得:
(29)
由(17)可得:
(30)
故由(29)~(30)可得:
(31)
故由(27)、(31)可得:
(32)
由EL系统的性质可得:
(33)
故由(25)、(32) (33)可得:
(34)
由于分布式优化算法(4)~(6)与智能体的动力学(1)耦合,因此最后一步给出整个系统的收敛性条件。
第四步:定义如下李雅普诺夫函数:
(35)
其中
为取值待定的正实数。根据(21)、(34)可知V的导数为:
(36)
对于式(36)给定
,选取合适的
使得
;通过选取合适的
和
使得
;接
下来,根据(34)、(36),对任意的
、
、
、
可得
。因此由Barbalat’s引理[20]可得
和追踪误差e的有界性。进而根据LaSalle不变集定理[21]可得
,
,
。因此,智能体真实状态的导数
追踪参考轨迹
,同时智能体的状态q渐近收敛到分布式优化问题(2)的全局最优解。
5. 数值仿真
本节利用MATLAB中的Simulink模块,搭建一个数值实验来验证EL系统在权重非平衡有向图下的分布式优化算法(3)~(6)的有效性。给出n个被建模成欧拉–拉格朗日系统(1)的智能体,这些智能体协同定位一个被m个参考信号
,
围绕的未知动态信号源[16],其中每个智能体只能感知对应的参考信号。因此系统的全局目标函数选取为
,其中
这表明每个智能体都倾向于靠近各自探测能力所及的参考信号,并且该目标函数满足假设2。智能体最终达成的一致性点是
的最优解,该最优解可以看作是对未知信号源的位置的估计。
在上述问题场景中,每一个智能体被建模为如下的EL系统:
(37)
其中
,
,
,此外
,
,
,上述元素中的参数分别选取为
,
,
。智能体之间的通讯拓扑结构如图1所示,该拓扑结构是非平衡有向图,并且是强连通的,由图1可知,该图拉普拉斯矩阵0特征值对应的左特征向量
。
考虑
和
的情形。每个智能体的动力学建模为(37)式。假设参考信号的位置为
,
,
,
,
。智能体的广义坐标初始化为
,
,
,
,
。
选取
,
,
,
和
。实验结果如图2~4所示。从图2可以看出,在分布式优化算法(4)~(6)的驱动下,所有智能体的广义坐标收敛到分布式优化问题(2)的全局最优解上。图3表示全局目标函数梯度的轨迹,当
时轨迹收敛到0,由引理2可知全局目标函数取到了最小值。图4表示由(6)式生成且初值满足(7)式的平衡补偿器
收敛到拉普拉斯矩阵L的0特征值对应的左特征向量
上。
Figure1.Communication topology among agents
图1.智能体通讯拓扑
Figure2.Trajectories of each agent’s state
图2.智能体状态轨迹
Figure3.Trajectories of the gradient of global cost function
图3.全局目标函数梯度轨迹
Figure4.Trajectories of balanced compensation variables
图4.平衡补偿变量轨迹
6. 总结
本文研究了欧拉–拉格朗日系统在权重非平衡有向图下的分布式优化问题,通过代数图论中有向拉普拉斯矩阵的性质,设计平衡补偿器以调节拓扑权重,将问题转化为权重平衡图下的分布式优化问题,进而设计相应的分布式优化算法,在本文的理论研究基础上,未来对于多欧拉–拉格朗日系统的分布式优化问题可以继续进行深入的研究。但本文所研究的工作,均为理论研究阶段。虽然通过实验验证了算法的有效性,但是展示性不够强。能否通过构建任务模型进行实物验证,使其具有更强的展示性是之后研究中值得考虑的问题。
基金项目
本论文由国家自然科学基金(项目号12161063)支持。
NOTES
*通讯作者。