本发明属于风电功率预测,尤其涉及一种基于多维特征提取的可解释深度学习风电功率预测方法及系统。
背景技术:
1、在全球日益强调清洁能源的当下,风力发电作为一种新型、绿色的能源形式越来越受到人们的关注。与传统的化石能源相比,风力发电具有无限的可再生性、环境污染较小、安装便捷、使用寿命长等优点。然而,风力发电系统的功率输出受到风速、风向、温度、湿度等不可控气象因素的影响,存在一定的波动性和不确定性,这不仅影响了风力发电的经济效益,同时也对电力系统的稳定性和可靠性构成了挑战。因此,准确预测风力发电功率可以改善风能利用中的不确定性,满足日益增长的电力需求,同时也能提升系统可靠性,维护电能质量,对电力系统调度和计划、电力市场化运营、智能电力管理等方面均具有非常重要的意义。
2、目前,风力发电功率的预测方法主要有物理方法、统计方法、人工智能方法和组合法。
3、物理模型预测方法主要包括nwp数据引入、风电机组轮毂高度处风速风向获取和风速-功率转化3个技术环节,即考虑风电场地形地貌等信息,将nwp数据转化为实际环境条件下的风资源信息,根据风电机组性能参数计算风电机组的预测功率,再累加得到整个场站的理论预测功率。该方法计算较为复杂,需通过求解多维偏微分方程组进行预测。
4、统计预测方法不考虑风速的物理变化过程,该方法通过统计算法来学习风电场历史气象、电力数据所表现出来的特征规律,然后结合实测功率数据或nwp数据预测风电场未来的发电功率,避免了复杂的物理建模过程,但需要大量数据进行学习建模,适用于已运行风电场。20世纪80年代有学者开始尝试用arma等经典时间序列模型进行功率预测。erginerdem按照风向将风速分解为横向和纵向分量,并分别构建arma模型进行预测,改善了预测结果。该方法建模简单,但适应性差,难以应对阵风、突变风等非平稳突变状况,同时其预测精度会随着时间的增加而下降,因此适用于超短期及短期功率预测。
5、人工智能预测方法能有效提取高维复杂非线性特征,并直接从输入映射到输出。预测模型不依赖于输出功率与影响因素之间的明确关系,而是从大量历史数据中学习进行预测,具有良好的鲁棒性和准确性。例如:人工神经网络(ann)、k近邻算法(knn)、模糊逻辑算法、随机森林算法等数据挖掘算法也常被用于风电功率预测。wang等人利用小波变换对数据序列进行分解,然后采用卷积神经网络(cnn)进行时序特征的学习和预测。hanifi等人对比了cnn和长短时记忆网络(lstm)的风电功率预测效果,以及参数优化带来的预测性能提升。但是,不同预测模型的精度偏差较大,需要通过模型优化、误差修正等环节进行提升。
6、深度学习算法相对于机器学习算法能够更全面地提取和保留数据特征,其预测模型适应性更好。人工智能预测方法不需要建立预测功率和气象数据之间具体的解析关系,通过大量数据训练即可获得很好的预测结果。然而,数据驱动的风电功率预测依然面临多方面的挑战。
7、首先,风电功率受气象、设备等很多因素的影响,在实际应用中采集的数据特征有限。如何充分利用数据特征中的有效信息,提高风电功率预测的精度是一个重要问题。
8、其次,许多数据驱动的风电功率预测方法主要关注时序数据的时间依赖性,对风力资源的周期性变化考虑不足,导致中长期预测的精度较低。
9、最后,风力发电预测模型的解释性较差。大部分模型都是以数据驱动为特征的,这种方法加深了预测的不确定性。同时,在模型的解释上也存在一定的难点,这导致了模型的使用者难以全面评估模型的有效性和可解释性,进而限制了模型的广泛应用。
10、通过上述分析,现有技术存在的问题及缺陷为:
11、(1)风电功率受气象、设备等很多因素的影响,在实际应用中采集的数据特征有限。
12、(2)许多数据驱动的风电功率预测方法主要关注时序数据的时间依赖性,对风力资源的周期性变化考虑不足,导致中长期预测的精度较低。
13、(3)风力发电预测模型的解释性较差。大部分模型都是以数据驱动为特征的,这种方法加深了预测的不确定性。同时,在模型的解释上也存在一定的难点,这导致了模型的使用者难以全面评估模型的有效性和可解释性,进而限制了模型的广泛应用。
技术实现思路
1、针对现有技术存在的问题,本发明提供了一种基于多维特征提取的可解释深度学习风电功率预测方法及系统。
2、本发明是这样实现的,一种基于多维特征提取的可解释深度学习风电功率预测方法包括:
3、步骤1,基于历史风电功率数据和风速数据,构建训练样本;
4、步骤2,采用最大互信息系数mic的非线性特征提取方法,对数据中特征进行筛选;
5、步骤3,对提取的关键特征变量,创建滞后特征向量;
6、步骤4,构建用于长期风电功率预测的timesnet+lstm模型;
7、步骤5,使用tree-structured parzen estimator优化算法对风电功率预测模型中lstm层单元数量以及丢弃率参数进行优化;
8、步骤6,通过引入shapley方法精确计算各个变量在合作中创造的边际利益,从而定量解释多维特征在风电预测中的具体贡献;
9、步骤7,利用训练好的模型对风电预测样本进行预测,获得预测发电功率。
10、进一步,所述非线性特征提取方法如下:
11、互信息计算公式如下:
12、
13、其中,p(x,y)为x,y之间的联合概率,给定一个有限的有序数据集,如式(2)所示:
14、d={(x1,y1),(x2,y2),...,(xm,ym1)} (2)
15、对集合d中的x,y构成的散点图进行网格划分,观察散点在各个方格中的分布情况,分别计算每个网格中的互信息;由于网格划分方式多种多样,选择不同划分方式下互信息的最大值,即可得到最终的mic,其计算公式如式(3)所示:
16、
17、其中,a和b分别是x,y方向上划分格子的个数,b是网格划分的上限值。
18、进一步,所述创建滞后特征向量方法如下:
19、对于筛选出的一个输入特征变量,设置其滞后阶数为1,即将其t-1时刻的值作为t时刻的值,创建一个新的变量。
20、进一步,所述构建用于长期风电功率预测的timesnet+lstm模型:
21、首先timesnet将原始时间序列转换为突出显示重要时间模式的表示形式,从时间序列数据中提取相关特征;
22、其次timesnet处理后的数据作为输入序列输入到lstm模型中,lstm捕捉数据中长期依赖关系并做出准确的预测。
23、进一步,所述tree-structuredparzen estimator(tpe)优化算法:
24、在每次试验中,对于每个超参,tpe为与最佳目标值相关的超参维护一个高斯混合模型l(x),为剩余的超参维护另一个高斯混合模型g(x),选择l(x)/g(x)最大化时对应的超参作为下一组搜索值;通过这种方式,tpe算法自适应地调整参数搜索空间的大小,并且在尽可能少的迭代次数内找到全局最优解。
25、进一步,所述shapley方法:
26、计算各个输入变量在风电功率预测模型中的具体贡献,揭示模型内部的运作机制。
27、本发明的另一目的在于提供一种基于多维特征提取的可解释深度学习风电功率预测系统包括:
28、训练样本构建模块,用于基于历史风电功率数据和风速数据,构建训练样本;
29、滞后特征向量创建模块,用于采用最大互信息系数mic的非线性特征提取方法,对数据中特征进行筛选;对提取的关键特征变量,创建滞后特征向量;
30、预测模型构建模块,用于构建用于长期风电功率预测的timesnet+lstm模型;
31、优化模块,用于使用tree-structured parzen estimator优化算法对风电功率预测模型中lstm层单元数量以及丢弃率参数进行优化;
32、计算模块,用于通过引入shapley方法精确计算各个变量在合作中创造的边际利益,从而定量解释多维特征在风电预测中的具体贡献;
33、预测模块,用于利用训练好的模型对风电预测样本进行预测,获得预测发电功率。
34、本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于多维特征提取的可解释深度学习风电功率预测方法的步骤。
35、本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于多维特征提取的可解释深度学习风电功率预测方法的步骤。
36、本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述基于多维特征提取的可解释深度学习风电功率预测系统。
37、结合上述的技术方案和解决的技术问题,从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:
38、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
39、非线性特征提取及滞后特征创建:目前特征选择的方法大多是基于pearson相关系数、spearman相关系数等线性函数来反映环境变量对风力发电功率的影响,而实际上,风电输出功率与众多变量之间存在显著的非线性特征。本发明采用最大互信息系数(mic)方法进行非线性特征提取,能够更准确地反映环境变量对风力发电功率的非线性影响。在特征选择的基础上,对关键特征进行滞后性处理,创建新的滞后特征(lag features)。做法是将时间序列中的过去值作为当前时刻的特征。这种方法可以帮助捕捉时间序列数据中的时间依赖性。
40、基于timesnet+lstm网络的风电功率预测模型:针对风力出力的周期性,将多维特征的风力时间序列进行二维重构,有效捕捉其周期内和周期间的变化。其中,周期内指一天内不同时间段的风力变化,周期间指三天中每天的周期性变化。再经过二层lstm提取时序特征,最后通过线性映射输出风电功率预测。
41、智能优化算法自动寻优模型超参数:目前使用的智能优化算法大多存在无法探索新的超参数空间、计算成本高、不支持异构计算资源等不足。本发明提出一种具有更强优化能力的tpe(tree-structured parzen estimator),是一种基于树结构的贝叶斯优化算法,可以更加高效地寻找最优模型参数,从而提高预测精度。在高维和复杂超参数空间中表现出色,能有效引导搜索过程,提高优化效率。
42、深度学习可解释性:以深度学习为代表的人工智能模型被视为“黑箱模型”,缺少模型的可解释性,无法量化环境变量对发电功率的影响程度和方向。本发明采用shapleyadditive explanations(shapely)可解释工具对模型进行分析,解决了深度学习模型“黑箱”问题,为决策者提供更加透明的信息,提高决策效率。
43、综上所述,本发明采用最新的非线性特征提取、滞后特征创建、timesnet+lstm网络结合具有更强优化能力的tpe(tree-structured parzen estimator)优化算法、可解释工具,对风力发电功率进行预测,能够更加准确地反映环境变量对风力发电的影响,实时响应环境变化,提高预测精度、实时性和优化效率,为风力发电行业提供更加可靠和高效的技术支持。
1.一种基于多维特征提取的可解释深度学习风电功率预测方法,其特征在于,包括以下步骤:
2.如权利要求1所述基于多维特征提取的可解释深度学习风电功率预测方法,其特征在于,所述非线性特征提取方法如下:
3.如权利要求1所述基于多维特征提取的可解释深度学习风电功率预测方法,其特征在于,所述创建滞后特征向量方法如下:
4.如权利要求1所述基于多维特征提取的可解释深度学习风电功率预测方法,其特征在于,所述构建用于长期风电功率预测的timesnet+lstm模型:
5.如权利要求1所述基于多维特征提取的可解释深度学习风电功率预测方法,其特征在于,所述tree-structuredparzen estimator优化算法:
6.如权利要求1所述基于多维特征提取的可解释深度学习风电功率预测方法,其特征在于,所述shapley方法:
7.一种实施如权利要求1-6任意一项所述基于多维特征提取的可解释深度学习风电功率预测方法的基于多维特征提取的可解释深度学习风电功率预测系统,其特征在于,所述基于多维特征提取的可解释深度学习风电功率预测系统包括:
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述基于多维特征提取的可解释深度学习风电功率预测方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述基于多维特征提取的可解释深度学习风电功率预测方法的步骤。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述基于多维特征提取的可解释深度学习风电功率预测系统。