赵广社, 张文慧, 高雷涛, 李国齐, 王鼎衡, 马凡波. 切换拓扑下时变非线性多智能体系统的一致性[J]. 信息与控制, 2020, 49(6): 641-648.
ZHAO Guangshe, ZHANG Wenhui, GAO Leitao, LI Guoqi, WANG Dingheng, MA Fanbo. Consensus of Time-varying Nonlinear Multi-agent Systems under Switching Topologies[J]. Information and Control, 2020, 49(6): 641-648.
1. 西安交通大学电子与信息学部自动化科学与工程学院, 陕西 西安 710049;
2. 西安交通大学智能网络与网络安全教育部重点实验室, 陕西 西安 710049 ;
3. 清华大学精密仪器系类脑计算研究中心, 北京 100084 ;
4. 青岛星跃铁塔有限公司, 山东 青岛 266300 1. Department of Automation Science and Technology, School of Electronic and Information Engineering, Xi'an Jiaotong University, Xi'an 710049, China;
2. Ministry of Education Key Lab For Networks and Network Security, Xi'an Jiaotong University, Xi'an 710049, China ;
3. Center for Brain Inspired Computing Research, Department of Precision Instrument, Tsinghua University, Beijing 100084, China ;
4. Qingdao Xingyue Iron Tower Co., Ltd, Qingdao 266300, China Abstract : To solve the consensus problem associated with multi-agent systems under Markovian switching topologies in which the union of switching topologies is an arbitrary network structure, we propose a construction method for any network structure. We also design a consensus protocol for the constructed network to solve the problem of leader-follower consensus for time-varying nonlinear multi-agent systems. First, by introducing a virtual leader node that connects with the minimum number of leaders in the union of switching topologies, we construct an arbitrary network structure so that the constructed network topology includes a directed spanning tree. Next, we design a consensus protocol with dynamic gain, and introduce consensus errors and state transitions to transform the system consensus problem into a design based on time-varying parameters. Based on Lyapunov's stability theory, we analyze the stability of time-varying nonlinear multi-agent systems under Markovian switching topologies. The results of simulation examples demonstrate the validity of the theoretical results. Keywords : leader-following consensus Markovian switching topology multi-agent system time-varying nonlinear

近年来,随着多智能体系统的协同控制在信息控制 [ 1 ] 、编队控制 [ 2 ] 、群集运动 [ 3 ] 等方面的广泛应用,已引起越来越多研究人员的关注.其中,一致性问题 [ 1 - 4 ] 作为协同控制的核心问题,更是得到了广泛的关注.多智能体一致性问题主要是研究多智能体系统中个体之间通过有限的信息交换,使所有智能体的状态达到某同一值的行为.在实际工程应用中,多智能体之间的信息交换因受到距离、障碍、干扰等多种不确定性因素的影响,会导致通信链路的中断或重建,使多智能体之间信息交换的准确性降低.通常使用切换拓扑来描述这种通信链路的改变.常见的切换拓扑有固定时间切换拓扑 [ 5 ] 和随机时间切换拓扑,而随机时间切换拓扑又可分为任意切换拓扑 [ 6 ] 、随机切换拓扑 [ 7 ] 和马尔可夫切换拓扑,其中马尔可夫切换拓扑包含任意和随机切换拓扑的特性更具一般性 [ 8 ] .因此,本文研究马尔可夫切换拓扑下多智能体系统的一致性.

目前,针对切换拓扑下线性多智能体一致性已经有诸多研究 [ 9 - 12 ] .文[ 9 ]研究了带有多种噪声干扰的马尔可夫切换拓扑下的一阶多智能体系统,设计了一致性协议,使系统分别实现均方平均趋同和概率1平均趋同.文[ 10 ]研究了当领导者状态为时不变时,马尔可夫切换拓扑下二阶多智能体系统的领导—跟随一致性.文[ 11 - 12 ]研究了马尔可夫切换拓扑下高阶多智能体系统的一致性问题,并指出系统实现一致性的条件是联合切换拓扑包含有向生成树.

上述研究都是针对线性系统,然而,自然界中几乎所有的物理系统都是非线性的,比如异步电动机系统 [ 13 ] 、飞控系统 [ 14 ] 和电力系统 [ 15 ] ,因此,研究非线性多智能体一致性更具应用价值.针对非线性多智能体一致性的研究也取得了很多成果 [ 16 - 22 ] .文[ 16 ]以一阶非线性系统为研究对象,文[ 17 - 18 ]研究了二阶非线性系统,事实上,很多物理系统具有高阶性的特点,高阶非线性系统也成为目前的研究热点.文[ 19 ]设计了动态输出一致性协议,研究了无向网络下,一类高阶非线性多智能体系统的领导—跟随一致性.文[ 20 ]提出了确定有向网络中最小数量领导者的方法,并设计了控制协议保证高阶时变非线性多智能体系统的一致性.更进一步,为了解决具有不同和未知的非线性多智能体系统的一致性问题,文[ 21 - 22 ]设计了自适应的一致性协议.与此同时,也需要考虑干扰、拓扑切换等对非线性多智能体一致性的影响.

针对切换拓扑下非线性多智能体一致性也有诸多研究 [ 23 - 26 ] .文[ 23 ]解决了具有通信时延的马尔可夫切换拓扑下高阶非线性多智能体系统的领导—跟随一致性问题,但其联合切换拓扑是无向连通的.文[ 24 ]对切换拓扑下非线性多智能体系统的领导—跟随一致性进行研究,但要求每个时刻的通信拓扑结构均包含有向生成树,且只讨论了两个拓扑在固定时间内切换.文[ 25 ]放宽了通信拓扑连接的限制,考虑部分时刻的拓扑结构包含有向生成树.文[ 26 ]得出了和线性系统相似的结论,指出实现马尔可夫切换拓扑下非线性多智能体系统一致性的条件是联合切换拓扑包含有向生成树.文[ 23 ]是针对无向通信网络.文[ 24 - 25 ]虽然是针对有向切换拓扑,但分别要求每一时刻和部分时刻的通信拓扑包含有向生成树.文[ 26 ]放宽了限制条件,只需联合切换拓扑包含有向生成树.分析上述研究成果可知,目前对切换拓扑下非线性多智能体系统一致性的研究中,仍对联合切换拓扑有限制,至少需要联合切换拓扑包含有向生成树,然而在大规模网络环境中确保网络的连通性仍是亟待解决的问题.在一般有向切换拓扑结构的通信条件下保证系统的一致性,更具实际意义.

本文考虑联合切换拓扑是任意有向网络结构,研究了马尔可夫切换拓扑下高阶非线性系统的一致性.相比于已有的研究成果,本文的创新之处在于:1)本文不需要对通信拓扑进行限制,考虑联合切换拓扑是任意有向网络结构;2)本文针对马尔可夫切换拓扑下高阶非线性系统设计了具有动态增益的一致性协议.

1 问题描述

符号和定义:用 G ={ v ε }表示由 N 个智能体组成的有向图,其中 v ={1,2,…, N }是图的顶点集合, ε v × v 是图的边集.有向图 G 的权值邻接矩阵为 Λ =[ a ij ]∈R N × N ,其中 a ij =1表示节点 i 可以接收到节点 j 的信息,否则 a ij =0.有向图 G 的入度矩阵表示为 D =diag( d 1 d 2 ,…, d N ),其中 .有向图 G 的拉普拉斯矩阵定义为 L = D - Λ .

本文用图 G 表示跟随者智能体之间的网络拓扑,用图 表示虚拟领导者与所有跟随者之间的网络拓扑.虚拟领导者和跟随者之间的连接,用邻接矩阵表示 Γ =diag( b 1 b 2 ,…, b N ),其中, b i >0表示虚拟领导者向第 i 个跟随者传递信息,否则, b i =0.拓扑 s 个不同的拓扑结构 之间随机切换,当随机变量 σ ( t )= m ∈{1,2,…, s }时, .联合切换拓扑图描述为 的拉普拉斯矩阵为 ,则联合切换拓扑 的拉普拉斯矩阵为 .

1.1 构造联合切换拓扑

本文针对联合切换拓扑是任意网络拓扑结构的多智能体系统一致性问题进行研究.由文[ 9 - 12 , 26 ]可知,切换拓扑下的多智能体系统实现一致性的条件是联合切换拓扑包含有向生成树.若联合切换拓扑是任意网络结构,特别是具有孤立的节点,如 图 1(a) 所示,则不能实现系统的一致性.因此,需要先对联合切换拓扑进行构造,使构造后的网络结构包含有向生成树.

本文借鉴文[ 20 ]的研究思想,研究马尔可夫切换拓扑下多智能体系统的一致性问题. 图 1 显示了对联合切换拓扑的构造过程,分两步进行:1)引入临时节点,如 图 1(b) 所示,通过最小树形图理论 [ 25 ] 找到任意网络结构中最少数量的领导者,结果如 图 1(c) ;2)引入虚拟领导者与定位最少数量领导者相连, 图 1(d) 即为构建后的联合切换拓扑.

引理1 [ 20 ] 对于任意的有向网络 G u ,找到最少数量的领导者,建立虚拟领导者与定位的最少数量的领导者相连,连接后的有向网络 是连通的,其中,虚拟领导者为有向生成树的根.

注1 文[ 26 ]证明了马尔可夫切换拓扑下非线性多智能体系统实现一致性的条件是联合切换拓扑包含有向生成树.本文针对联合切换拓扑可以是任意网络结构的多智能体系统进行研究,给出了将联合切换拓扑构造为有向生成树的方法,其应用更具普适性.

1.2 拓扑切换过程描述

用连续时间马尔可夫过程描述切换过程{ σ ( t ), t ≥0},它在有限的状态集合{1,2,…, s }上取值,其转移密度矩阵为 Q =[ q ij ] s × s ∈R s × s .连续时间马尔可夫过程的转移概率密度表示为

其中, o (d t )表示d t 的高阶无穷小.

1.3 多智能体模型

在引入虚拟领导者节点与任意网络结构的最少数量的领导者相连后,将联合切换拓扑为任意网络结构的多智能体系统的一致性问题转化为虚拟领导者节点和多智能体系统的领导—跟随一致性问题.这里,构造的联合切换拓扑 ,由原任意网络结构的联合切换拓扑 和虚拟领导者结点组成.

考虑由 N 个跟随者智能体和一个虚拟领导者智能体组成的具有非线性动态模型为

其中, k =0表示虚拟领导者智能体, k =1,2,…, N 表示跟随者智能体; x k =[ x k ,1 x k ,2 ,…, x k n ] T 是第 k 个智能体的状态; A B 是任意常数矩阵; u k k =1,2,…, N 是需要设计的控制协议, u 0 是给出的虚拟领导者智能体的控制协议; f (·)=[ f 1 f 2 f 3 ,…, f n ] T f i 是时间 t 和状态 x k ,1 x k ,2 ,…, x k i ( i =1,2,…, n )的函数.

定义1 在任何有限初始状态 x 0 下,存在正数 C t 0 ,使:

其中, η ( t )= c 1 e c 2 t .

注2 η ( t )是定义在[0,+∞)上任何已知的指数函数.通过选取适当的 c 1 c 2 ,指数函数 c 1 e c 2 t 可以作为许多时变函数的边界.因此,满足假设1的系统(2)包含了许多类型的时变系统.

引理3 [ 19 ] 是连通的,若拓扑图包含一个以虚拟领导者为根节点的生成树,则 是正定的.

引理4 [ 27 ] 存在行向量 K =[ k 1 k 2 ,…, k n ],使得 是Hurwitz矩阵,这里 表示克罗内克积, I N 表示 N 维单位矩阵,存在正定矩阵 P ,满足:

注3 可以通过引理3求得,其中 Γ 是虚拟领导者和多智能体系统之间的邻接矩阵.为了获得引理4中的行向量 K 和正定矩阵 P ,首先要找到 的特征值 λ 1 λ 2 ,…, λ N ,则可以通过 A + λ j BK j =1,2,…, N 是联立的Hurwitz矩阵确定 K ,正定矩阵 P 可以通过式(5)确定.

2 算法和一致性协议设计 2.1 寻找最少数量领导者算法

对于任意网络结构 G u ,引入一个临时节点 T 与每一个结点连接构成拓扑图 G * .在拓扑图 G * 中,令连接临时节点 T 的有向边,权值置1,如不连接临时节点,权值置0,如 图 2(a) 所示.由文[ 20 ]可知,寻找拓扑图 G 的最少数量领导者问题可转化为寻找图 G * 的最小树形图问题,从而可使用朱刘算法 [ 28 ] 解决.在图 G * 的最小树形图中,与临时节点 T 相连的节点,即为图 G u 的最少数量领导者节点,如 图 2(b) 所示,节点1、节点4、节点5即为 图 1(a) 所示网络拓扑的最少数量的领导者.

对有向图 G * ( ν ε ),求其最小树形图的算法过程如下:

步骤1 :对除根节点以外的 N -1个节点,选择权值最小的输入有向边,构成有向边集 s .若没有形成环, G * ( ν s )即为最小树形图;否则,转到步骤2.

步骤2 :将每一个环中的节点收缩为一个伪节点 m ,修改每条从环外节点 i 指向环内节点 j 的有向边的权值:

其中, a ( x ( j ), j )是有向环内指向 j 的权值.

步骤3 :对每个伪节点和实节点,选择权值最小的输入有向边.若有环,转到步骤2;否则,转到步骤4.

步骤4 :记录当前的有向边,展开收缩点,去除环中与记录的有向边相同终点的边.

2.2 设计一致性协议

若拓扑结构为 ,选择合适的时变参数 W ( t ),设计如下的一致性协议:

其中, R (·)∈R n 将在之后确定, W ( t )是时变方程,在 t ≥0时,都有 W ( t )≥1.在 拓扑结构下,若节点 i 可以接收节点 j 的信息, a ij =1,否则, a ij =0;若节点 k 可以接收虚拟领导者节点的信息, b k =1,否则, b k =0. u 0 是时间 t 的函数,表示虚拟领导者的输入信息.在式(6)中,为了便于表达,使用 W u 0 表示 W ( t )和 u 0 ( t ),省略变量 t ,下文同.

定义一致性误差为

其中, H =diag( n n -1,…,1), k =1,2,… N ψ k = ξ ( f ( t x k )- f ( t x 0 )).

因此,求解一致性误差(8)的稳定性问题又可转换为求取时变参数 W 保证系统(10)的稳定性问题.为求解系统(10)的稳定性,引入如下定理.

定理1 存在时变参数 W ( t ),使系统(10)的稳定性可通过如下的一致性协议解决:

因此,一致性误差 e =0,在 ,2,…, N 时成立.从而,式(6)中的未知变量 R ( W )确定为 R ( W )=- .至此,系统(2)的一致性得证.

对于系统(2),一致性协议的设计步骤如下:

步骤1 :引入临时节点与任意网络拓扑的每个节点连接,将连接临时节点的有向边,权值置1,若没有连接,权值置0.

步骤2 :通过朱刘算法,对步骤1的有向图求最小树形图,标记与临时节点相连的节点,并引入虚拟领导者与其相连.

步骤3 :通过引理4获得 K P .

步骤4 :通过假设1和从步骤3解出的 K P ,根据式(18)~式(23)确定参数 ε α .

步骤5 :通过步骤4获得的参数 ε α ,由式(24)求解出 W ( t ).

步骤6 :通过步骤3和5获得 K W ( t ),得到系统(2)的一致性协议(27).

3 数值仿真

本节通过具体实例来证明马尔可夫切换拓扑下时变非线性多智能体系统(2)在一致性协议(27)下的领导—跟随一致性.

考虑如 图 3(a) 所示的联合切换拓扑图 G u ,使用朱刘算法可以确定最少数量的领导者为节点1、节点4和节点5,建立一个虚拟领导者结点0与节点1、节点4和节点5连接,构造的联合切换拓扑图 ,如 图 3(b) 所示,包含有向生成树.

其中, k =1,2,…,8.令 ,可知,当 η ( t )=0.2e 2 t 时,假设1的条件满足.进一步选取 W ( t )=7e 2 t +20, u 0 =20+sin t .

用连续时间的马尔可夫过程 m t 来描述拓扑切换过程, m t 的状态空间为 S ={1,2,3},状态转移密度矩阵为 Q = ,初始概率分布为 . 图 5 是马尔可夫过程 m t 描述的拓扑切换信号,其中,状态1、2、3分别表示当前多智能体系统的网络拓扑结构为

随机给定多智能体系统的初始状态为: X (0)=[ x 0 T x 1 T x 2 T x 3 T x 4 T x 5 T x 6 T x 7 T x 8 T ]=[0, -1, -2, -4, -6, -8, -6, -4, -2, 0, 1, 2, 4, 6, 8, 6, 4, 2],系统的拓扑结构随着 图 5 所示的拓扑状态切换信号在 之间变换.系统的状态轨迹如 图 6 所示,可以看出,跟随者智能体的状态轨迹逐渐收敛到虚拟领导者智能体的状态轨迹,即联合切换拓扑是任意网络结构的多智能体系统实现了全局一致性.同时,实验结果说明通过引入虚拟领导者对联合切换拓扑进行构造,在所提的一致性协议下,构造后的网络能够实现马尔可夫切换拓扑下时变非线性多智能体系统的领导—跟随一致性.

Liu Y Y, Slotine J J, Barabasi A L. Controllability of complex networks[J]. Nature, 2011, 473(7346): 167. DOI:10.1038/nature10011 Dong X, Yu B, Shi Z, et al. Time-varying formation control for unmanned aerial vehicles:Theories and applications[J]. IEEE Transactions on Control Systems Technology, 2015, 23(1): 340–348. DOI:10.1109/TCST.2014.2314460 Gazi V. Stability of an asynchronous swarm with time-dependent communication links[J]. IEEE Transactions on Systems, Man and Cybernetics-Part B, 2008, 38(1): 267–274. DOI:10.1109/TSMCB.2007.910530 Fragoso M D, Costa O L V. A unified approach for stochastic and mean square stability of continuous-time linear systems with Markovian jumping parameters and additive disturbances[J]. Proceedings of the IEEE Conference on Decision and Control, 2005, 44(4): 1165–1191. 余莹莹, 方华京. 多智能体系统的有限时间跟踪控制[J]. 系统工程与电子技术, 2011, 33(8): 1871–1874.
She Y Y, Fang H J. Finite-time tracking control for multi-agent systems[J]. Journal of Systems Engineering and Electronics, 2011, 33(8): 1871–1874.
DOI:10.3969/j.issn.1001-506X.2011.08.36 Zhu W, Cheng D. Leader-following consensus of second-order agents with multiple time-varying delays[J]. Automatica, 2010, 46: 1994–1999. DOI:10.1016/j.automatica.2010.08.003 Tahbaz-Salehi A, Jadbabaie A. Consensus over ergodic stationary graph processes[J]. IEEE Transactions on Automatic Control, 2010, 55(1): 225–230. DOI:10.1109/TAC.2009.2034054 明平松, 刘建昌. 随机多智能体系统一致稳定性分析[J]. 控制与决策, 2016, 31(3): 385–393.
Ming P S, Liu J C. Consensus stability analysis of stochastic multi-agent systems[J]. Control and Decision, 2016, 31(3): 385–393. Zhang Q, Zhang J F. Distributed parameter estimation over unreliable networks with Markovian switching topologies[J]. IEEE Transactions on Automatic Control, 2012, 57(10): 2545–2560. DOI:10.1109/TAC.2012.2188353 Zhao H. Leader-following consensus of data-sampled multi-agent systems with stochastic switching topologies[J]. Neurocomputing, 2015, 167: 172–178. DOI:10.1016/j.neucom.2015.04.080 Dai J, Guo G. Event-based consensus for second-order multi-agent systems with actuator saturation under fixed and Markovian switching topologies[J]. Journal of the Franklin Institute, 2017, 354(14): 6098–6118. DOI:10.1016/j.jfranklin.2017.07.011 Ming P, Liu J, Tan S, et al. Consensus stabilization of stochastic multi-agent system with Markovian switching topologies and stochastic communication noise[J]. Journal of the Franklin Institute, 2015, 352(9): 3684–3700. DOI:10.1016/j.jfranklin.2015.03.015 Wang Z Q, Liu X X. Nonlinear internal model control for bearingless induction motor based on neural network inversion[J]. Acta Automatica Sinica, 2013, 39(4): 433–439. DOI:10.1016/S1874-1029(13)60043-9 Ronch A D, Badcock K J, Wang Y, et al. Nonlinear model reduction for flexible aircraft control design[J]. International Journal of Modelling Identification&Control, 2012(2): 113–124. Yan R, Dong Z Y, Saha T K, et al. A power system nonlinear adaptive decentralized controller design[J]. Automatica, 2010, 46(2): 330–336. DOI:10.1016/j.automatica.2009.10.020 Tang Y. Output consensus of nonlinear multi-agent systems with unknown control directions[J]. Kybernetika, 2015, 51(2): 335–346. 张振华, 彭世国. 时延多智能体系统领导跟随一致性研究[J]. 计算机应用研究, 2019, 36(2): 420–424.
Zhang Z H, Peng S G. Research on leader-following consensus of multi-agent systems with time delays[J].
Application Research of Computer, 2019, 36(2): 420–424. Yu W, Chen G, Cao M, et al. Second-order consensus for multiagent systems with directed topologies and nonlinear dynamics[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2010, 40(3): 881–891. DOI:10.1109/TSMCB.2009.2031624 Wang X H, Ji H B. Leader-follower consensus for a class of nonlinear multi-agent systems[J]. International Journal of Control Automation&Systems, 2012, 10(1): 27–35. DOI:10.1007/s12555-012-0104-3 Gao L, Zhao G, Li G, et al. Allocating minimum number of leaders for seeking consensus over directed networks with time-varying nonlinear multi-agents[J]. International Journal of Control Automation and Systems, 2019, 17(1): 57–68. DOI:10.1007/s12555-018-0057-2 Liu W, Huang J. Adaptive leader-following consensus for a class of higher-order nonlinear multi-agent systems with directed switching networks[J]. Automatica, 2017, 79: 84–92. DOI:10.1016/j.automatica.2017.02.010 基于自适应控制的非线性多智能体系统一致性[J]. 重庆理工大学学报(自然科学版), 2019, 33(11): 137–142.
Tang Z J. Adaptive consensus for nonlinear multi-agent systems[J]. Journal of Chongqing University of Technology (Natural Science), 2019, 33(11): 137–142. He P, Li Y, Park J H. Noise tolerance leader-following of high-order nonlinear dynamical multi-agent systems with switching topology and communication delay[J]. Journal of the Franklin Institute, 2016, 353(1): 108–143. DOI:10.1016/j.jfranklin.2015.10.013 Bing C, Zhao C, Ma T, et al. Leaderless and leader-following consensus of multi-agent chaotic systems with unknown time delays and switching topologies[J]. Nonlinear Analysis Hybrid Systems, 2017, 24: 115–131. DOI:10.1016/j.nahs.2016.11.007 Wen G, Duan Z, Chen G, et al. Consensus tracking of multi-agent systems with Lipschitz-type node dynamics and switching topologies[J]. IEEE Transactions on Circuits&Systems I-Regular Papers, 2014, 61(2): 499–511. Zhang X, Liu L, Feng G. Leader-follower consensus of time-varying nonlinear multi-agent systems[J]. Automatica, 2015, 52: 8–14. DOI:10.1016/j.automatica.2014.10.127 Chu Y J, Liu T H. On the shortest arborescence of a directed graph[J]. Scientia Sinica, 1965, 14: 1396–1400. 赵广社, 张文慧, 高雷涛, 李国齐, 王鼎衡, 马凡波 ZHAO Guangshe, ZHANG Wenhui, GAO Leitao, LI Guoqi, WANG Dingheng, MA Fanbo
切换拓扑下时变非线性多智能体系统的一致性
Consensus of Time-varying Nonlinear Multi-agent Systems under Switching Topologies
信息与控制, 2020, 49(6): 641-648.
Information and Control, 2020, 49(6): 641-648.
http://dx.doi.org/10.13976/j.cnki.xk.2020.0013