基于自适应动态规划的互联系统安全保障控制

Published:

随着工业系统规模的增大以及人工智能技术特别是机器学习的发展,大规模复杂系统的控制方法在多个领域得到应用。作为复杂系统中的基础问题,互联系统稳定控制以及智能体博弈纳什均衡往往具有很强的耦合性以及非线性,也一直是多智能体领域的研究热点。大规模系统通常是重点安全控制系统,需要通过一定的优化约束条件来满足系统的安全运行要求。为了保障系统运行的安全稳定,可以在系统的控制层面加入安全保障机制。安全保障控制器就是一种在原有的系统层级控制策略架构上拓展的决策机制,通过对系统危险倾向进行反向补偿,实现整体状态的安全稳定运行,因此安全保障控制器的研究对重点安全的大规模系统稳定安全具有很高的研究价值。 本文主要设计了一种针对包括互联系统、非零和博弈在内的复杂系统的安全保障控制器,不仅能够满足凸集合的安全边界约束要求,还可以满足传统安全控制器无法满足的非凸集合安全约束要求。同时安全保障控制补偿项可以和任意名义控制器结合,灵活适用各种系统,对系统参数的变化具有良好的抗干扰性,对安全边界的约束具有一定的自适应性。本文分别针对复杂系统中的非零和博弈系统以及互联系统的特性进行安全保障控制器设计。这种保障安全的控制器设计主要分为三个部分。首先设计一种基于障碍函数梯度的安全保障的控制器补偿项。其次根据自适应动态规划理论建立名义控制器,非零和博弈系统中需要满足多个智能体非零和博弈下的纳什均衡,而互联系统中则需要利用分布式稳定性理论设计分布式稳定控制器。最后利用并行学习的更新律对控制器逼近的神经网络进行迭代,借助单一评判网络方法,在得到适用性广泛的安全保障控制器的同时,减少了神经网络逼近参数迭代过程中一半的计算量。 在此基础上,本文借助李雅普诺夫稳定性理论分别证明了非零和博弈与互联系统在安全保障控制器作用下的稳定性,并且证明得到并行学习更新律的参数最终一致有界。本文通过数值仿真实验对互联系统以及非零和博弈的理论分析结果进行验证,表明在所设计的基于障碍函数的安全保障控制器的作用下,复杂系统能够在非凸性以及凸性安全约束下保障状态变量的安全。 为了进一步验证基于障碍函数的安全保障策略在实际应用场景下的效果,本文设计了无人机的硬件模拟实验对安全保障策略进行验证,表明在所设计的安全策略作用下,无人机复杂系统能够在避开固定障碍物以及无人机互相避让控制下保障安全。

Download paper here

Recommended citation: 谭, 浚楷 (2023). 基于自适应动态规划的互联系统安全保障控制. False.
Download Paper