本技术涉及控制,特别涉及一种具有安全保障能力的高实时显式控制律设计方法及装置。
背景技术:
1、在现代控制系统中,高实时性和安全性是实现精确、可靠控制的关键要求。高实时控制系统需在极短的时间内做出响应以适应快速变化的环境和系统状态,而安全控制则保证系统不会违反安全约束。因此,设计能同时满足这两种需求的控制策略具有极高的应用价值,尤其是在航空航天、自动驾驶汽车和工业自动化等领域。
2、相关技术中,可以将mpc(model predictive control,模型预测控制)为代表的优化方法作为一种可行的安全控制策略,可以利用rl(reinforcement learning,强化学习)为代表的学习型方法,通过离线学习求解控制策略使得在线应用时迅速做出决策,也可以通过某些显式设计的控制策略提供快速的决策执行。
3、然而,相关技术中,由于mpc需要在线实时求解优化问题,在应用于复杂的系统动力学和约束问题时计算负担较高,导致mpc在需要快速响应的高实时应用中具有局限性,由于rl缺乏直观的求解过程和保证精度的理论支持,可能依赖于训练过程中的数据质量和覆盖范围,限制了在各类环境下的适应性和可靠性,由于某些显式设计的控制策略需要针对特定问题进行精心设计,并依赖于特定的控制率解析形式,可能降低通用性和灵活性,亟待改进。
技术实现思路
1、本技术提供一种具有安全保障能力的高实时显式控制律设计方法及装置,以解决相关技术中,由于mpc计算负担高,在高实时应用中有局限性,由于rl缺乏理论支持且依赖数据,可能导致适应性和可靠性受限,且由于某些显式设计的控制策略依赖特定问题和形式,降低通用性和灵活性等问题。
2、本技术第一方面实施例提供一种具有安全保障能力的高实时显式控制律设计方法,包括以下步骤:建立系统状态随时间变化的微分方程;基于所述微分方程选取合适的基函数,以线性组合所述基函数形成控制律;基于所述微分方程、所述基函数和所述控制律构建控制李雅普诺夫函数和控制障碍函数;将所述控制李雅普诺夫函数和所述控制障碍函数作为约束条件,以优化所述控制律的组合系数,直至达到预设显式控制律性能标准,得到最终设计结果。
3、可选地,在本技术的一个实施例中,将所述控制李雅普诺夫函数和所述控制障碍函数作为约束条件,包括:通过设计控制障碍函数以作为优化问题硬约束;通过设计控制李雅普诺夫函数以作为优化问题硬约束或者包含状态误差的优化目标以作为优化问题软约束。
4、可选地,在本技术的一个实施例中,所述性能标准包括决定系数、均方误差、均方根误差和平均绝对误差中的至少之一。
5、可选地,在本技术的一个实施例中,其中,所述决定系数为:
6、
7、其中,r2为决定系数,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,为所有yi的平均值,n为拟合数据的总数量,i为第i个数据;
8、所述均方误差为:
9、
10、其中,mse为均方误差,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,n为拟合数据的总数量,i为第i个数据;
11、所述均方根误差为:
12、
13、其中,rmse为均方根误差,mse为均方误差,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,n为拟合数据的总数量,i为第i个数据;
14、所述平均绝对误差为:
15、
16、其中,mae为平均绝对误差,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,n为拟合数据的总数量,i为第i个数据。
17、可选地,在本技术的一个实施例中,所述达到预设显式控制律性能标准对应的显式控制律为:
18、
19、其中,u为控制输入向量,为自由选取的具有拟合能力的一组基,{θ1(x),θ2(x),…,θm(x)}为与每个基相对应的组合系数,m为选取的基组合中基的总数量,i为第i个基,π(x)为反馈控制律。
20、本技术第二方面实施例提供一种具有安全保障能力的高实时显式控制律设计装置,包括:第一构建模块,用于建立系统状态随时间变化的微分方程;第二构建模块,用于基于所述微分方程选取合适的基函数,以线性组合所述基函数形成控制律;第三构建模块,用于基于所述微分方程、所述基函数和所述控制律构建控制李雅普诺夫函数和控制障碍函数;优化模块,用于将所述控制李雅普诺夫函数和所述控制障碍函数作为约束条件,以优化所述控制律的组合系数,直至达到预设显式控制律性能标准,得到最终设计结果。
21、可选地,在本技术的一个实施例中,所述优化模块包括:第一设计单元,用于通过设计控制障碍函数以作为优化问题硬约束;第二设计单元,用于通过设计控制李雅普诺夫函数以作为优化问题硬约束或者包含状态误差的优化目标以作为优化问题软约束。
22、可选地,在本技术的一个实施例中,所述性能标准包括决定系数、均方误差、均方根误差和平均绝对误差中的至少之一。
23、可选地,在本技术的一个实施例中,其中,所述决定系数为:
24、
25、其中,r2为决定系数,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,为所有yi的平均值,n为拟合数据的总数量,i为第i个数据;
26、所述均方误差为:
27、
28、其中,mse为均方误差,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,n为拟合数据的总数量,i为第i个数据;
29、所述均方根误差为:
30、
31、其中,rmse为均方根误差,mse为均方误差,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,n为拟合数据的总数量,i为第i个数据;
32、所述平均绝对误差为:
33、
34、其中,mae为平均绝对误差,yi为第i个数据的真实值,为拟合模型对应的第i个数据的预测值,n为拟合数据的总数量,i为第i个数据。
35、可选地,在本技术的一个实施例中,所述达到预设显式控制律性能标准对应的显式控制律为:
36、
37、其中,u为控制输入向量,为自由选取的具有拟合能力的一组基,{θ1(x),θ2(x),…,θm(x)}为与每个基相对应的组合系数,m为选取的基组合中基的总数量,i为第i个基,π(x)为反馈控制律。
38、本技术第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的具有安全保障能力的高实时显式控制律设计方法。
39、本技术第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的具有安全保障能力的高实时显式控制律设计方法。
40、本技术第五方面实施例提供一种计算机程序产品,所述计算机程序被执行时,以用于实现如上的具有安全保障能力的高实时显式控制律设计方法。
41、本技术实施例可以建立系统状态随时间变化的微分方程,基于微分方程选取合适的基函数,以线性组合基函数形成控制律,进而,基于微分方程、基函数和控制律构建控制李雅普诺夫函数和控制障碍函数,从而,将控制李雅普诺夫函数和控制障碍函数作为约束条件,以优化控制律的组合系数,直至达到预设显式控制律性能标准,得到最终设计结果,有助于提供安全性与稳定性的理论保障,有效提高控制率设计的灵活性,满足实时性和安全稳定控制需求。由此,解决了相关技术中,由于mpc计算负担高,在高实时应用中有局限性,由于rl缺乏理论支持且依赖数据,可能导致适应性和可靠性受限,且由于某些显式设计的控制策略依赖特定问题和形式,降低通用性和灵活性等问题。
42、本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
1.一种具有安全保障能力的高实时显式控制律设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述将所述控制李雅普诺夫函数和所述控制障碍函数作为约束条件,包括:
3.根据权利要求1所述的方法,其特征在于,所述性能标准包括决定系数、均方误差、均方根误差和平均绝对误差中的至少之一。
4.根据权利要求3所述的方法,其特征在于,其中,
5.根据权利要求1所述的方法,其特征在于,所述达到预设显式控制律性能标准对应的显式控制律为:
6.一种具有安全保障能力的高实时显式控制律设计装置,其特征在于,包括:
7.根据权利要求6所述的装置,其特征在于,所述优化模块包括:
8.根据权利要求6所述的装置,其特征在于,所述性能标准包括决定系数、均方误差、均方根误差和平均绝对误差中的至少之一。
9.根据权利要求8所述的装置,其特征在于,其中,
10.根据权利要求6所述的装置,其特征在于,所述达到预设显式控制律性能标准对应的显式控制律为:
11.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-5任一项所述的具有安全保障能力的高实时显式控制律设计方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-5任一项所述的具有安全保障能力的高实时显式控制律设计方法。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被执行,以用于实现如权利要求1-5中任一项所述的具有安全保障能力的高实时显式控制律设计方法。
