Research on Improving Dynamic Multi Swarm Particle Swarm Optimization Algorithm for UAV Path Planning
The core objective of this paper is to evaluate the application effect of improved Dynamic Multi Swarm Particle Swarm Optimization (DMPG) algorithm in UAV path planning, especially its performance in dynamic environments. This algorithm aims to enhance its adaptability and optimization performance in dynamic environments by introducing dynamic weight adjustment mechanisms and various swarm strategies. In addition, this article also combines deep reinforcement learning (DRL) technology to improve the autonomous decision-making ability of drones in complex environments. By constructing a detailed simulation environment, we conducted a comprehensive performance evaluation of the DMPG algorithm, including its obstacle avoidance ability, path planning efficiency, and response speed to dynamic changes. The simulation results show that the DMPG algorithm performs well in dynamic environments, not only effectively avoiding obstacles, but also achieving significant improvements in the global and robust aspects of path planning. Compared with existing static and dynamic path planning algorithms, the DMPG algorithm has demonstrated excellent performance in key performance indicators such as average path length, obstacle avoidance success rate, and task completion time. These findings provide new insights for the study of drone path planning and valuable references for future research and applications in related fields.
Particle Swarm Algorithm
无人机是一种无需驾驶员在机内操控执行飞行任务的飞行器,目前已在世界各地用于各种危险或耗时的任务,例如测量、搜索和救援等。尽管无人机最初是为军事应用而开发的,但它们的用途后来已经扩展到许多其他领域,包括科学应用、娱乐活动、法律执法等
在规划无人机的路径时,应考虑各种限制,例如环境不确定性、加速度和速度限制以及空间中不可到达的点。然而大部分传统的路径规划算法大多计算效率低且易陷入局部极值,因此受自然生物启发的智能算法,由于其在处理无人机动态约束方面的有效性以及在复杂环境中路径寻优的能力,在无人机路径规划研究中越来越普遍。如灰狼优化算法(Gray wolf optimization, GWO)
粒子群算法是在1995年由美国社会心理学家Kennedy和电气工程师Eberhart提出的
粒子群优化算法在实现过程中,种群的每个粒子代表鸟群中的鸟,每个粒子个体具有两个属性:速度和位置,并在D维空间内进行随机搜索得到两个极值,分别为个体极值和全局极值,用Pid和Pgd表示
其中, 表示粒子速度, 表示第k次迭代中第d维的速度, 表示粒子的位置, 代表第k次迭代中第d维的位置, 表示粒子群到目前为止所出现的个体极值, 表示粒子群到目前为止所出现的全局极值; 、 表示学习因子; 表示权重系数。
传统的粒子群算法的所有参数都是固定的,因此算法易理解易操作,但是在解决实际复杂工程问题上,要么搜索不到全局最优解,要么就是搜索到全局最优解需要消耗大量时间成本,固定的参数往往都不能很好地解决问题,导致结果不理想。
PSO算法和其他群体智能算法及其他优化算法相比,具有形式简单、易于使用、收敛速度较快等优点,但在解决一些复杂优化问题时,也会像其它算法一样,存在难以摆脱局部最优、执行效率低、全局搜索能力和局部搜索能力难以平衡等缺陷。为解决这些问题,研究者引入了群体智能算法的并行策略,常见的即将整个种群分为多个子种群,然后通过设计子种群间的信息交互机制来使多个子种群能在并行化执行的同时使算法的性能不下降甚至得到提升,这种并行化策略又称为多种群策略,设计群体智能算法的多种群策略的关键在于设计良好的子种群间的信息交互机制。由于粒子群优化算法在求解复杂多峰问题时易陷入局部最优解,因此学者们采用了多种改进方法提高算法全局搜索能力。包括作者前面实现的混合粒子群算法以及改进量子粒子群算法等,除了这些以外,文献
多种群PSO算法其实也是一种基于特殊邻域拓扑结构的局部PSO算法,相比于固定划分多种群,动态随机重组可以避免过于限制粒子的自由,提升个体信息交流效率。文献基于分类的思想以适应度值的均值和标准差为测度,通过评价粒子的位置关系将种群分为多个等级。但是在迭代后期,优秀种群会吸引更多个体加入,将导致粒子过于聚集,种群间信息交流困难。所以,本文在此基础上以适应度值,升序的中位值为界划分子种群,每一代都实行动态调整。适应度值较小的为“顶层粒子”,较大的为“底层粒子”;再从两者当中分别抽出同等数量的粒子组成局部PSO模型,并确保3个种群规模均衡,分别为离最优解较近的“优势群”、局部PSO模型的“混合群”以及“劣势群”。“优势群”中的粒子适应度值较小,需要继承种群中最优解的位置信息,缩小步长进行更加细密的搜索;而“劣势群”中的粒子则应扩大“步伐”,在向全局极值靠近的同时探索周围新的优解来提升开采能力;作为局部模型的“混合群”既包含较优粒子,也包含较差粒子,将动态调整种群的多样性,既要吸取个体经验,也要共享全局信息。
粒子群算法在优化后期收敛速度变得缓慢的主要原因是其难以摆脱当前局部极值,导致精度下降。为增强优势群跳出局部最优的能力,引入作者在前面的文章中提到的莱维飞行,莱维飞行以大小步间隔形式进行,此类飞行方式加强了粒子活性及跳跃能力,扩大粒子搜索范围,有利于增强粒子多样性,避免算法陷入局部最优,能够提升算法收敛精度和速度。因此将该方法引入对于优势群的更新中,可弥补算法优势群无更新的不足。
(1)
同时,莱维飞行虽能使粒子摆脱局部最优,但并不能保证更新后的粒子位置优于原位置,所以为避免无意义的位置更新,本文引入贪婪算法的评价策略决定是否更新最优粒子位置,即当更新后的位置优于原位置时,才进行位置更新,否则保留原位置,实现过程如式所示:
(2)
其中, 为贪婪算法更新后的粒子位置,f( )代表粒子适应度函数。
“劣势群”中具有保留价值的粒子信息较少,其种群远离问题优解,可以通过变异的方式在整个空间搜索最优解,变异可以在整个搜索空间中寻找各种可能的解区域,也可以避免过早收敛和增加子种群的多样性。变异判断如下:
(4)
其中,r和N(0, 1)是[0, 1]之间的随机数,x为原始参数值,GV(x)为变异后的值。当第一个式子成立时,可执行式第二个式子对粒子进行高斯变异操作。多次迭代后判断式成立的几率逐渐减小,粒子发生变异的几率也逐渐降低。变异操作可在初始阶段使粒子以较大概率发生变异,扩大粒子在解空间中的搜寻范围,保证了粒子群的多样性。除此之外,引入混合粒子的概念变更传统速度更新的公式,混合粒子记为pmix(k),pmix(k)的维度值由各粒子历史最优值随机混合而成,如
式中c3为混合学习因子,r3为(0, 1)间随机数。由式可知,混合粒子由当前各粒子的历史最优混合而成,既继承了各粒子的优良维度,同时具有随机性,兼顾了粒子多样性和优异性。混合粒子作为一个牵引因素引导粒子的速度更新,可以有效解决陷入局部最优的问题,同时其自身优异性也使粒子朝着较优方向进化。通过这样两个策略,多方向的随机扰动在一定程度上增强了搜索过程中的多样性。这样的寻优方式非常适合“劣势群”中的粒子在解空间中进行波动性搜索,加深局部学习。
混合群介于两者之间,由于个体间的差异在算法前期较大,侧重于其认知部分,可以实现多方交流,而在后期,加强全局极值的引领力,能够促使粒子向最优解的周围聚集。因此,学习因子引入余弦、正弦函数,使自身学子因子单调递减,种群学习因子单调递增。综上,混合群的速度更新公式为:
由于惯性权重因子影响PSO算法性能,其值较大时有利于全局范围的搜索,较小的权重值有利于加快算法的收敛速度,对于局部的细致开发益处较大,因此可设置其在搜索初期权重因子较大,有助于提升全局搜索能力;在搜索后期,权重因子较小,有助于增强局部的开发能力,通过这种非线性惯性权重来平衡整个种群的局部和全局的勘探能力。
算法流程如下
动态多种群粒子群算法(DMPG)是一种用于解决优化问题的算法,它结合了粒子群优化(PSO)的基本原理和动态多群策略。以下是DMPG算法的一般流程:
1) 初始化种群:创建多个子群,每个子群包含一定数量的粒子。为每个粒子分配随机的初始位置和速度。定义问题的优化目标函数。
2) 评估适应度:计算每个粒子的适应度值,即目标函数的值。
3) 更新个体经验:对于每个粒子,根据其当前位置和最佳历史位置(个体极值pBest),更新速度和位置。
4) 更新子群极值:在每个子群内,找出适应度最高的粒子,更新子群极值(local best lbest)。
5) 动态调整子群规模:根据子群的表现,动态调整子群的规模,如合并表现较差的子群,分裂表现较好的子群。
6) 信息共享与迁移:在不同子群之间进行信息共享,允许粒子迁移到其他子群,以促进种群多样性和全局搜索能力。
7) 全局极值更新:在所有子群中,找出适应度最高的粒子,更新全局极值(global best gBest)。
8) 判断终止条件:如果满足终止条件(如达到最大迭代次数或解的质量满足预设标准),则停止迭代。
输出结果:返回全局极值作为问题的最优解。
在实际应用中,DMPG算法的具体实现可能会根据问题的特点和求解需求进行相应的调整和优化。例如,可以通过引入混沌理论来增强粒子的随机性,或者采用自适应调整机制来动态调整算法参数,以提高算法在动态环境中的适应性和性能。
无人机路径规划的目的是从起始地点到指定终点规划出一条合理路径,保证无人机在飞行过程中无安全问题,合理规避危险区域,如过高的山峰、雷达干扰等也是无人机需要考虑的因素。以上因素也可以看作求解一个多约束条件的函数最优问题。
对无人机使用群智能算法进行航迹规划时,代价函数是用来评价航迹质量的重要指标,也是体现算法性能的重要依据。本文将从以下三个方面设置代价函数:
本文选择最小化路径长度判断路径是否最优。无人机是通过地面控制站控制的,因此无人机的飞行路径Ci表示由n个航点组成的列表,每一个航点对应路径规划搜索地图中的一个路径节点。假设共有i条飞行路径,j个路径节点,每个节点坐标可以表示为 ,因此路径长度代价为。
(8)
除了路径长度最优之外,路径规划中的路径还必须要确保无人机的安全运行,可能会遇到被称为威胁区域的禁飞区(例如雷达探测、防空装备攻击或天气威胁等),都会对无人机的飞行安全造成一定影响。考虑到威胁建模的复杂性和获取真实数据的困难性,本文对威胁环境进行了抽象化处理,将威胁区域抽象为一个半径为定值的圆柱体,威胁区域的作用半径等同于圆柱体的半径,设置威胁区域的目的是为了满足无人机的飞行环境,让无人机成功避开威胁区域以完成飞行任务
设M为所有存在威胁的障碍物集合;障碍物模型为圆柱体,其投影的圆心为Cm;Rm为障碍物的半径;D为无人机的直径,相邻两个路径节点与原点的垂直距离为dm,S表示障碍物的危险区域,该值取决于无人机的定位精度与飞行环境。如果无人机处于静态环境中且GPS信号良好,那么S的值可能是几十米;如果环境中存在移动的物体或GPS信号差,那么S的值将超过百米。对于一个路径,其威胁代价计算式为:
(9)
(10)
当无人机在危险区域以外的地方飞行时,不存在碰撞的风险,其代价为零;而当无人机经过危险区域时,dm越小威胁代价越大;当无人机途经碰撞区域时,无人机会碰撞坠毁,此时设定该路径的威胁代价赋值为无穷。
频繁的调整飞行高度不仅会增加能源消耗,同时也不利于飞行的安全,因此希望无人机在飞行过程中尽可能保持平稳。高度代价函数如下:
M为无人机总质量,g为重力加速度,Dz为前后两个航迹点的高度差。
综合路径Ji的路径长度代价、威胁代价、高度代价,可将无人机三维路径规划的代价函数F定义为:
(12)
其中a1、a2、a3为权重系数,并且满足和为1。
由于每次生成的点是离散的,所以生成的路径是折线形式,为了保证路线适合实际飞行,还需对路径进行平滑处理。论文采用引入三次方样条数据插值的策略,以保证生成的路径是适合飞行的光滑路径。
在无人机路径规划研究中,动态多种群粒子群优化(DMPG)算法的应用需遵循一系列精细化、系统化的约束条件,以确保路径规划的精准性、安全性及合规性。具体而言,环境约束要求算法具备高效的障碍物检测与规避机制,确保无人机在复杂环境中稳定运行,同时应能灵活适应动态环境变化,规避不可预测的障碍物。此外,无人机的飞行活动必须严格限制在指定空域内,避免越界飞行。任务约束方面,无人机应确保覆盖所有预设的关键节点,并根据任务的优先级和紧急程度进行合理排序,以优化任务执行效率。在能源约束方面,算法需实时监测无人机的电量状态,制定合理的飞行计划以延长续航时间。同时,应优化飞行路径以减少能耗,确保无人机在有限的能源条件下完成任务。此外,无人机在飞行过程中应保持与障碍物的安全距离,并遵守速度限制,以降低事故风险。法规约束要求无人机的飞行活动必须严格遵守国家和地区的航空法规,包括但不限于空域使用规定、飞行高度限制以及通信覆盖要求等。同时,无人机应具备稳定的数据传输能力,以满足实时传输任务数据的需求。在实际应用中,DMPG算法应综合考虑以上约束条件,通过精细的参数调整和策略优化,实现对无人机路径的精确规划,以满足各种复杂场景下的任务需求。
由结果可以看出,面对此类复杂的优化问题,传统的PSO算法极易陷入局部最优,而经过改进后的算法能够提升其跳出局部最优的能力。当然,因为跑程序花的时间比较长,这里仅设置其迭代数为40,可以通过调节迭代、种群数等参数获得更优解。
论文深入分析了DMPG算法在动态环境下的局限性,包括粒子间信息共享不足、适应性差以及局部最优解的风险。随后,提出了一系列针对性的改进措施,旨在增强算法的全局搜索能力、提高信息共享效率以及避免陷入局部最优解。具体改进措施包括引入自适应学习因子以动态调整粒子的学习速率,改进粒子更新策略以优化粒子的运动轨迹,以及优化粒子群结构以增强算法对动态环境的适应性。这些改进不仅提高了算法的收敛速度,而且增强了其在复杂环境中的鲁棒性,此外论文设计了一系列仿真实验,并与现有的DMPG算法进行了比较。仿真结果表明,改进后的DMPG算法在路径长度、飞行时间以及避障能力等方面均取得了显著的改进。此外,算法在应对突发事件和动态障碍物时表现出了更好的鲁棒性和适应性。
项目信息1:2023海南省大学生创新创业训练计划项目–昼夜图像识别检测跟踪无人机,项目编号-S202313892011;
项目信息2:三亚学院虚拟教研室试点建设项目,项目编号-SYJZXN202303。