本发明涉及dc-dc变换器控制领域,特别涉及一种基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法。
背景技术:
1、随着微电网、电动汽车和可再生能源的快速发展,dc-dc变换器被广泛用于电动汽车、太阳能发电系统、工业自动化系统等方面。在dc-dc变换器运行过程中,各种因素可能导致输出电压的波动,如输入电压的变化、负载的突变以及环境温度的变化等。因此,需要设计有效的反馈控制环路和适当的补偿策略,以确保输出电压的稳定性。精度是电压控制的另一个重要指标。需要设计合适的控制器,尽量较少输出电压的静态误差。此外,响应速度和动态性能也是电压控制中需要关注的问题。在复杂的应用场景中,变换器可能需要面对多种不同的负载模式和输入电压变化等问题。当负载或输入电压发生突变时,变换器需要迅速调整输出电压以保持稳定,这需要变换器具备良好的动态性能,能够迅速适应各种变化并保持输出电压的稳定。因此dc-dc变换器的控制器设计仍然面临着精确和快速保持所需输出电压的挑战。
2、传统的基于模型的控制方法对模型的精度有较高要求。在实际应用中,获取精确的动力学模型往往非常困难,这不仅需要深入理解系统的物理特性,还需要进行复杂的建模和参数辨识。模型参数的偏差可能会导致整个控制策略失效,严重影响系统的控制性能。而无模型控制方法与基于模型的控制方法相比,具有不需要精确动力学模型、设计简单、实时性和适应性强等优势。在建模困难或实时性要求高的场景中,无模型控制方法能更有效地应对系统变化,简化系统设计,从而提高系统整体性能。因此,复杂的现实场景下,无模型控制方法是一个更为合适和高效的选择。
技术实现思路
1、本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,通过自适应动态规划和批量梯度下降方法对神经网络控制器的权重和偏置进行更新,使得目标函数最小,实现对dc-dc变化器的最优控制,与传统的电压控制和电流控制方法相比,训练完成的神经网络控制器能够实现对dc-dc变换器的最优控制,并且在负载跳变、输出电压跳变等情况下都保持一个较快的响应速度和较小的超调量。
2、本发明采用如下技术方案:
3、一种基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,包括:
4、s1,构建神经网络控制器,并随机生成神经网络控制器的初始参数;所述神经网络控制器的输入量包括输出电压和额定电压的误差量e(t)、误差量的积分∫e(t)dt和误差量的微分输出控制信号,控制信号与三角载波进行比较,得到占空比;神经网络控制器网络为单隐藏层,隐藏层包括三个神经元,隐藏层激活函数为双曲正切函数,输出层激活函数为sigmoid函数;
5、s2,构建自适应动态规划的目标函数,所述目标函数基于输出电压和额定电压的误差量;
6、s3,基于神经网络控制器搭建变换器闭环电路,并启动电路;以采样频率f采集输入占空比、输出电压、输出电流以及输出电压和额定电压的误差量e(t)、误差量的积分∫e(t)dt和误差量的微分数据,并计算目标函数值;
7、s4,基于目标函数值,通过批量梯度下降方法对神经网络控制器的权重和偏置进行迭代;
8、s5,根据迭代结果更新神经网络控制器,重复s3到s5,直至目标函数值达到目标值或迭代至给定迭代次数停止,得到最优控制器,输出最终的神经网络控制器权重和偏置;
9、s6,基于最优控制器对dc-dc变换器进行控制。
10、优选的,所述目标函数表示如下:
11、
12、其中,e表示目标函数;vo(k)表示k时刻采样的输出电压;vref(k)表示k时刻的参考电压;n表示输出电压采样点总数。
13、优选的,通过批量梯度下降方法对神经网络控制器的权重和偏置进行迭代,迭代公式表示如下:
14、
15、其中,wi+1表示第i+1次迭代时神经网络的权重;wi表示第i次迭代时神经网络的权重;a为学习率,通常为0到1之间;ei表示第i次迭代时目标函数值;表示第i次迭代时目标函数对权重的梯度值;bi+1表示第i+1次迭代时神经网络的偏置;bi表示第i次迭代时神经网络的偏置;表示第i次迭代时目标函数对偏置的梯度值。
16、优选的,第i次迭代时目标函数对权重的梯度值及目标函数对偏置的梯度值表示如下:
17、
18、其中,n表示输出电压采样点总数;vo(k)表示k时刻采样的输出电压;d(k)表示k时刻的占空比;vref(k)表示k时刻的参考电压;表示k时刻的输出电压的预测值;通过dc-dc变换器拟合模型间接获得。
19、优选的,所述dc-dc变换器拟合模型采用bp神经网络拟合的方法得到,通过dc-dc变换器拟合模型求取的方法如下:
20、构建bp神经网络,所述bp神经网络以d(k)、d(k-1)、vo(k-1)、vo(k-2)、r(k)和r(k-1)作为输入数据,以vo*(k)作为输出;其中,d(k)、d(k-1)分别表示控制器在k和k-1时刻的占空比值;vo(k-1)、vo(k-2)分别表示变换器在k和k-1时刻的输出电压值;r(k)和r(k-1)分别表示负载在k和k-1时刻的电阻值,根据采集的输出电压与输出电流相除得到;设置bp神经网络为单隐藏层,隐藏层包括四个神经元,隐藏层激活函数为双曲正切函数,输出层激活函数为线性函数;
21、搭建变换器电路实物模型,在变输入占空比和输出负载的情况下开环运行,采集占空比、输出电压和输出电流数据,并将采集的数据用于训练dc-dc变换器拟合模型;
22、使用lm算法对bp神经网络进行训练,选择验证结果最好的一个模型作为最终的变换器拟合模型;
23、将采集的数据输入dc-dc变换器拟合模型,得到近似的输出电压vo*(k),进而求取参数。
24、优选的,所述和为批量数据梯度的累计值,而非某个数据的梯度值。
25、与现有技术相比,本发明的有益效果如下:
26、(1)本发明通过数据驱动的方式实现了对dc-dc变换器的最优控制,与传统的控制方式相比,不受被控对象数学模型的限制,控制方法不需要知道所控制系统的状态空间表达式,只需要通过系统的输入输出数据就能实现对系统的最优控制;该方法解决了传统控制方法中控制器参数求解复杂、系统模型难以精确建立等问题;在复杂的电路模型中,传统的控制方法只能根据经验对控制器参数进行设计,本方法通过自适应动态规划算法,自动更新神经网络控制器的权重和偏置,方法更为迅速、精确、简便,因此可以广泛应用于各种复杂系统,包括那些难以建立精确数学模型的系统,同时所提的控制方法对于大时滞、强干扰、强耦合、时变和非线性等问题具有良好的处理能力;
27、(2)本发明的自适应动态规划方法,通过设置合适的目标函数,以最小化目标函数为目的,结合批量梯度下降算法对神经网络控制器的权重和偏置进行更新,最终得到最优的神经网络控制器。与传统方式相比,超调量更小,响应时间更快;
28、(3)本发明的神经网络控制器是离线训练的,因此所提出的神经网络控制器可以很容易地使用低成本的dsp实现。
1.一种基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,其特征在于,包括:
2.根据权利要求1所述的基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,其特征在于,所述目标函数表示如下:
3.根据权利要求1所述的基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,其特征在于,通过批量梯度下降方法对神经网络控制器的权重和偏置进行迭代,迭代公式表示如下:
4.根据权利要求3所述的基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,其特征在于,第i次迭代时目标函数对权重的梯度值及目标函数对偏置的梯度值表示如下:
5.根据权利要求4所述的基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,其特征在于,所述dc-dc变换器拟合模型采用bp神经网络拟合的方法得到,通过dc-dc变换器拟合模型求取的方法如下:
6.根据权利要求3所述的基于自适应动态规划和数据驱动的dc-dc变换器最优控制方法,其特征在于,所述和为批量数据梯度的累计值,而非某个数据的梯度值。