一种传染病流行期间短期电力负荷预测方法及装置

allin2023-03-23  147



1.本技术属于电力负荷预测技术领域,尤其涉及一种传染病流行期间短期电力负荷预测方法及装置。


背景技术:

2.短期电力负荷预测(short-term load forecasting,简称stlf)是指对一个小时到一周的电力负荷需求值进行预测。预测得到的短期电力负荷需求值有助于提高电力系统对电能的调度效率。虽然由于电力负荷需求的不确定性和波动性,准确的短期电力负荷预测很有挑战性,但一些深度学习模型已经取得了不错的预测精度,如卷积神经网络(convolutional neuralnetworks,简称cnn)和循环神经网络(recurrent neural networks,简称 rnn)。
3.由于传染性疾病的易感特性,许多国家和地区都出台了相关对策,要求人们遵守严格的社交距离限制,而这些社交距离限制会导致电力负荷需求在短时间内大幅下降,使得传统的电力负荷预测模型难以准确地预测传染病流行期间的电力负荷需求。同时,应用于短期电力负荷预测领域的传统深度学习模型通常使用过去的电力负荷需求值、时序信息和天气数据作为输入特征。然而,使用这些传统特征的深度学习模型很难捕捉到传染病流行期间的电力负荷需求的变化,因为它们没有结合相关的社会和经济变化信息。


技术实现要素:

4.本技术的目的是提供一种传染病流行期间短期电力负荷预测方法及装置,构建了一个包含移动数据的知识库,该知识库能够反映基于移动服务的不同区域和建筑中的客流量变化。移动数据所包含的社会经济行为变化信息使得预测模型能够对电力负荷在短时间内的大幅下降进行预测。
5.为了实现上述目的,本技术技术方案如下:
6.一种传染病流行期间短期电力负荷预测方法,包括:
7.构建包括不同地理区域电力负荷数据、时间信息、天气数据和移动数据的知识库;
8.以构建的知识库训练迁移深度学习模型,所述迁移深度学习模型的输入为不同地理区域的时间信息、天气数据和移动数据,所述迁移深度学习模型的输出为不同地理区域的短期电力负荷预测结果,在训练中以深度强化学习来确定所述迁移深度学习模型共享权重层的最优超参数,所述深度强化学习的状态为所述迁移深度学习模型共享权重层的超参数,所述深度强化学习的动作为调整所述超参数的具体动作,所述深度强化学习的奖励为预测精度相关函数;
9.以训练好的采用最优超参数的迁移深度学习模型进行电力负荷预测。
10.进一步的,所述超参数包括迭代次数、批大小和学习率。
11.进一步的,所述预测精度为平均绝对百分比误差。
12.进一步的,所述在训练中以深度强化学习来确定所述迁移深度学习模型共享权重
层的最优超参数,还包括:
13.将深度强化学习遍历过的状态及其对应的q值作为训练集,训练极端梯度提升机;
14.使用训练后的极端梯度提升机预测未被深度强化学习遍历过的状态的q值,选取最大q值所对应的状态,作为所述超参数的最优值。
15.进一步的,所述权重共享层采用rnn循环神经网络层。
16.本技术还提出了一种传染病流行期间短期电力负荷预测装置,包括处理器以及存储有若干计算机指令的存储器,所述计算机指令被处理器执行时实现所述传染病流行期间短期电力负荷预测方法的步骤。
17.本技术提出了一种传染病流行期间短期电力负荷预测方法及装置,覆盖12个不同国家和城市的真实数据集被用以验证所提出的模型的性能。
18.根据多组对比实验的结果,总结出以下四点结论:
19.(1)知识库中所包含的社会经济行为的变化信息有助于深度学习模型预测传染病流行期间电力负荷的突然下降。这也为全球其他突发事件下的电力负荷预测提供了新的方向。
20.(2)通过充分利用知识库中的社会经济行为变化信息,本技术所提出的迁移深度学习模型可以克服与传染病流行相关的移动数据有限的问题。
21.(3)所提出的基于强化学习的超参数优化方法能够自动优化迁移深度学习模型的超参数。
22.(4)所提出的提前预测方法通过预测未遍历过的状态空间的状态-行为值,提高了强化学习智能体的超参数优化效率。
附图说明
23.图1为本技术传染病流行期间短期电力负荷预测方法流程图;
24.图2为本技术提前预测示意图。
具体实施方式
25.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本技术,并不用于限定本技术。
26.在一个实施例中,如图1所示,提供了一种传染病流行期间短期电力负荷预测方法,包括:
27.步骤s1、构建包括不同地理区域电力负荷数据、时间信息、天气数据和移动数据的知识库。
28.本技术所构建的知识库包括归一化后的四类数据:电力负荷数据、时间信息、天气数据和移动数据。该知识库的数据涵盖了12个不同的地理区域,包括英国(uk)、德国(germany)、法国(france)、加州独立系统运营商(caiso)地区、nyiso地区、达拉斯(dallas)、休斯顿(houston)、圣安东尼奥(san antonio,简称sa)、波士顿(boston)、芝加哥(chicago)、费城 (philadelphia)和西雅图(seattle)。数据时间跨度为2020年2月15日至2020 年5月15日,涵盖了颁布严格的社交距离限制之前和之后的时间段。
29.(1)电力负荷数据表示不同地理区域的以小时为单位的电力负荷需求值。其中,欧洲地区的电力负荷数据来自欧洲输电网运营商,美国的电力负荷数据来自美国各自独立的系统运营商。
30.(2)时间信息指的是用独热编码表示的星期几和时刻的相关信息。
31.(3)天气数据来自世界天气在线,包含云量、湿度、降水量、气压、温度等信息。
32.(4)移动数据来自谷歌和苹果公司,揭示了不同区域和不同建筑中的客流量的相对变化。谷歌公司的移动数据揭示了六个不同地点的游客数量的相对变化:零售和娱乐场所、杂货店和药店、公园、中转站、工作场所和居民区。数据的基准值是2020年1月3日至2020年2月6日这5周的中位数。从苹果公司获得的移动数据揭示了三种移动类型的游客数量的相对变化:驾驶、交通和步行。数据的基准值为2020年1月13日的相关数据。谷歌和苹果公司都是根据用户账户的历史位置以收集信息的。
33.步骤s2、以构建的知识库训练迁移深度学习模型,所述迁移深度学习模型的输入为不同地理区域的时间信息、天气数据和移动数据,所述迁移深度学习模型的输出为不同地理区域的短期电力负荷预测结果,在训练中以深度强化学习来确定所述迁移深度学习模型共享权重层的最优超参数,所述深度强化学习的状态为所述迁移深度学习模型共享权重层的超参数,所述深度强化学习的动作为调整所述超参数的具体动作,所述深度强化学习的奖励为预测精度相关函数。
34.本技术采用构建的知识库训练迁移深度学习模型,并以训练好的迁移深度学习模型来预测目标区域的短期电力负荷。采用迁移深度学习模型来解决与疫情相关的移动数据过少的问题,该模型可以利用从源域中学习到的迁移知识以预测其他的目标学习任务,并可以解决传染病流行期间的移动数据有限的问题。在本技术中,不同源域的数据指的是不同地理区域的时间信息、天气数据和移动数据,不同的学习任务指的是不同地理区域的短期电力负荷预测问题。
35.迁移深度学习的定义如下:给定源域ds、源学习任务ts、目标域d
t
和目标学习任务t
t
,在ds≠d
t
,ts≠t
t
的情况下,迁移深度学习模型利用从ds和ts中学到的迁移知识,以提高目标预测函数r
t
(
·
)在d
t
中的学习能力。根据上述定义,迁移深度学习的每个域被定义为d={f,p(x)},其中f={f1,

,fn}是一个n维的特征空间,x={x1,

,xn}∈f为学习样本,p(x)为x的边际概率分布。特征空间和边际概率分布在不同的域中是不同的。每个学习任务被定义为t={y,r(
·
)},其中y为实际的电力负荷需求的值空间,r(
·
)为预测函数。
36.在一个具体的实施例中,迁移深度学习模型包含输入层、共享权重层、隐藏层和输出层。本技术就是优化出共享权重层的超参数,包括迭代次数、批大小和学习率,提高迁移深度学习模型的预测精度。而通过迁移学习,解决传染病流行期间的移动数据有限的问题。在一个具体的实施例中,权重共享层采用的是rnn循环神经网络层,隐藏层采用的是全连接层。rnn 是循环神经网络,对于处理连续的时序特征效果较好;并且rnn的超参数较少,强化学习调参的时候的时间复杂度会比较小。权重共享层亦可采用其他神经网络,如lstm、cnn、resnet等。
37.本技术使用不同源域(所构建的12个地区的包含移动数据的知识库) 的数据对上述迁移深度学习模型进行训练,并得到最终模型的网络权重。
38.最后,依次将不同学习任务(12个地区的电力负荷预测任务)的数据输入训练好的
迁移深度学习模型,不同地区的数据通过权重共享层后,再在隐藏层中进行操作,最后分别得到不同学习任务的预测结果。
39.为了得到所述迁移深度学习模型共享权重层的最优超参数,本技术采用了深度强化学习(q-learning)来优化共享权重层的超参数。
40.深度强化学习会将问题建模为马尔可夫决策过程,在该类模型中,强化学习智能体通过在环境中不断地试错进行学习。强化学习智能体的目标是选择一个能够使期望折扣奖励最大化的行为。本技术使用深度强化学习方法对所提出的迁移深度学习模型的超参数进行优化,以提高模型的预测精度。马尔可夫决策过程被定义为《s,a,p,r》:s指的是强化学习智能体所有可能存在的有效状态的集合,每一个状态由不同大小的迭代次数、批大小和学习率组成。s指的是某一特定的状态,其中a指的是强化学习智能体所有可能执行的动作的集合。在每个时间点,强化学习智能体将执行六个候选动作中的一个,并相应地更改迭代次数、批大小或学习率的值。a指的是某一特定的动作,其中p指的是所构建的环境中强化学习智能体的转移概率分布。r指的是强化学习智能体的奖励函数,t表示不同的时间点,k表示未来的时间步长,r
t+k
表示强化学习智能体在k个时间步长后获得的奖励。γ是平衡即时奖励和未来奖励的重要性的折扣因子。本技术以测试集的预测精度accuracy
t
作为强化学习智能体更新奖励的信号,r
t
=1-accuracy
t
,且r
t
∈(0,1)。
41.q
π
(s,a)被定义为状态-行为值,表示在状态s下按照策略π:s

a执行动作a所获得的期望累计折扣奖励,如公式(1)所示:
[0042][0043]
其中,s
t
和a
t
分别表示t时刻强化学习智能体所处的状态和所执行的动作。本技术通过采用q-learning算法来连续估计最优的状态-行为值,以期得到最优的策略π
*
(s)∈argmaxaq
*
(s,a),q
*
(s,a)指的是最优的状态-行为值。状态-行为值也可以用q值来表示。q-learning算法中的核心公式,即bellman 方程如公式(2)所示:
[0044][0045]
基于强化学习的超参数优化方法的伪码如算法1所示,其中q(
·
,
·
)表示为所有时间点的状态-行为值的集合,q
t+1
(s
t
,a
t
)的值表示为t+1时刻的q 值。在强化学习中,一个训练周期指的是强化学习智能体与环境交互的一个完整来回,其包含不同时间步长。
[0046][0047]
表1
[0048]
在q-learning中,初始化迭代次数、批大小和学习率的值,作为t时刻的状态s
t
。在每个时间点,通过ε-greedy算法获取动作a
t
。a
t
是一个整数,其不同的值表示不同的对于超参数值大小的操作,如表2所示。
[0049][0050][0051]
表2
[0052]
以状态s
t
运行迁移深度学习模型,模型的超参数为t时刻的迭代次数、批大小和学习率的值,并得到t时刻的迁移深度学习模型的预测精度,其通过平均绝对百分比误差(mean absolute percentage error,简称mape) 来表示,如公式(3)所示:
[0053][0054]
其中,n为预测的总小时数,yi和pi分别为第i小时的电力负荷实际值和预测值。
[0055]
根据t时刻的迁移深度学习模型的预测精度获得t时刻的奖励r
t
,并执行选择的动作a
t
,得到新的状态s
t+1
,即新的一组的迭代次数、批大小和学习率的值。然后更新q值和t+1时刻的状态,重复上述步骤,直到到达提前设定的终止时间步长。选择所有时间点中q值最大的对应状态(迭代次数、批大小和学习率),表示为优化后的超参数值。
[0056]
需要说明的是,关于迁移学习与q-learning的具体实现,在本领域是比较成熟的技术,这里不再赘述。
[0057]
步骤s3、以训练好的采用最优超参数的迁移深度学习模型进行电力负荷预测。
[0058]
在得到最优超参数后,在采用该最优超参数的情况下训练好迁移深度学习模型,然后即可以采用训练好的迁移深度学习模型来预测短期电力负荷。在预测时,输入时间信息、天气数据和移动数据,输出预测的电力负荷。
[0059]
在一个具体的实施例中,为了提高强化学习智能体的超参数优化效率,从而获得更优的超参数,在深度强化学习时,采用了提前预测方法,包括:
[0060]
将深度强化学习遍历过的状态及其对应的q值作为训练集,训练极端梯度提升机;
[0061]
使用训练后的极端梯度提升机预测未被深度强化学习遍历过的状态的q值,选取最大q值所对应的状态,作为所述超参数的最优值。
[0062]
在本实施例中,通过极端梯度提升机(extreme gradient boosting,简称xgboost)实现。如图2所示,每个q值代表强化学习智能体在不同时间点遍历过或未遍历过的状态空间的状态-行为值。
[0063]
本实施例采用基于强化学习的超参数优化方法的迁移深度学习模型中,强化学习智能体遍历了一部分状态,并得到了相应的q值。图2中的灰色方块表示强化学习智能体遍历过的状态,以及它们相对应的q值。白色的方块表示没有被遍历过的状态,以及它们相对应的q值。将强化学习智能体遍历过的状态及其对应的q值划分为训练集和测试集,用于训练 xgboost。最后,使用经过训练的xgboost模型预测未被强化学习智能体遍历过的状态的q值,在图2中用带有斜线的正方形来表示。然后,选取最大的q值所对应的状态,即表示为超参数的最优值。
[0064]
本技术还通过实验来验证模型的预测精度,使用本技术所构建知识库的rnn模型(rnn_kb)和不使用知识库的rnn模型(rnn)的预测结果如表3所示:
[0065][0066]
表3
[0067]
如表3所示,使用知识库的rnn模型的预测精度高于不使用知识库的rnn模型。对法国、德国、英国、nyiso、caiso、达拉斯、休斯顿、圣安东尼奥、波士顿、芝加哥、费城和西雅图的预测精度分别提高了40.5%、 49.2%、12.5%、64.9%、57.5%、9.1%、33.8%、0.2%、58.5%、70.6%、75.1%和56.3%。实验表明知识库,特别是其中包含的移动数据,可以有效地提高深度学习模型在传染病流行期间的电力负荷预测精度。
[0068]
迁移深度学习模型和不使用迁移学习的rnn模型(rnn_kb)的预测结果如表4所示。需要注意的是,rnn_kb的预测结果与表3的结果不同,因为表4中的结果是重新运行5次模型而得到的。
[0069][0070]
表4
[0071]
如表4所示,与不使用迁移学习的rnn模型相比,迁移深度学习模型在8个数据集
(法国、德国、英国、达拉斯、休斯顿、波士顿、费城和西雅图)上的预测精度更高,仅在4个数据集(nyiso、caiso、圣安东尼奥和芝加哥)上的预测精度较低。总的来说,迁移深度学习模型优于不使用迁移学习的rnn模型,这归结于迁移深度学习模型可以利用移动数据中包含的社会经济行为变化信息。
[0072]
而在基于强化学习的超参数优化,并采用提前预测方法,实验中草参数的取值范围为:迭代次数[0,30],批大小[30,60],学习率[0,0.005]。在不同训练周期和时间步长的预测结果如表5所示。不同的训练周期和时间步长的组合意味着强化学习智能体可以遍历的状态数。例如,5个训练周期和10个时间步的组合意味着强化学习智能体最多可以遍历50个状态。变量ep、bs和lr分别代表模型在不同的训练周期和时间步长的组合下,迭代次数、批大小和学习率的最佳值。state_num表示强化学习智能体所遍历的状态数。time表示在不同的训练周期和时间步长下训练所提出的模型所需的时间成本。mape用以评估模型的预测精度。
[0073]
[0074][0075]
表5
[0076]
表4和表5的预测结果表明,本技术的预测精度高于普通迁移深度学习模型的预测精度,在法国、德国、英国、nyiso、caiso、达拉斯、休斯顿、圣安东尼奥、波士顿、芝加哥、费城和西雅图这12个数据集上分别提高了14.6%、13.6%、26.2%、24.6%、21.6%、64.5%、53.4%、71.0%、 20.1%、17.7%、30.1%和37.2%。提前预测方法的使用显著提高了强化学习智能体的超参数优化效率。例如,在法国数据集上,当训练周期为30,时间步长为30时,强化学习智能体可以遍历多达900个(30
×
30)状态。然而,强化学习智能体实际上只遍历了608个状态并获得了相应的q值,遍历608个状态共花费了39765秒(即11.05小时)。剩余的292(900-608) 个状态的q值是用提前预测方法预测的。因为这292个状态实际上没有被遍历过,所以可以认为使用提前预测方法共节省了约19097秒 (292/608*39765)的时间成本(即5.30小时)。
[0077]
在一个实施例中,本技术还提供了一种传染病流行期间短期电力负荷预测装置,包括处理器以及存储有若干计算机指令的存储器,所述计算机指令被处理器执行时实现所述传染病流行期间短期电力负荷预测方法的步骤。
[0078]
关于传染病流行期间短期电力负荷预测装置的具体限定可以参见上文中对于传染病流行期间短期电力负荷预测方法的限定,在此不再赘述。上述传染病流行期间短期电力负荷预测装置可全部或部分通过软件、硬件及其组合来实现。可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0079]
存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器中存储有可在处理器上运行的计算机程序,所述处理器通过运行存储在存储器内的计算机程序,从而实现本发明实施例中的网络拓扑布局方法。
[0080]
其中,所述存储器可以是,但不限于,随机存取存储器(random accessmemory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器 (erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。其中,存储器用于存储程序,所述处理器在接收到执行指令后,执行所述程序。
[0081]
所述处理器可能是一种集成电路芯片,具有数据的处理能力。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0082]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。

技术特征:
1.一种传染病流行期间短期电力负荷预测方法,其特征在于,所述传染病流行期间短期电力负荷预测方法,包括:构建包括不同地理区域电力负荷数据、时间信息、天气数据和移动数据的知识库;以构建的知识库训练迁移深度学习模型,所述迁移深度学习模型的输入为不同地理区域的时间信息、天气数据和移动数据,所述迁移深度学习模型的输出为不同地理区域的短期电力负荷预测结果,在训练中以深度强化学习来确定所述迁移深度学习模型共享权重层的最优超参数,所述深度强化学习的状态为所述迁移深度学习模型共享权重层的超参数,所述深度强化学习的动作为调整所述超参数的具体动作,所述深度强化学习的奖励为预测精度相关函数;以训练好的采用最优超参数的迁移深度学习模型进行电力负荷预测。2.根据权利要求1所述的传染病流行期间短期电力负荷预测方法,其特征在于,所述超参数包括迭代次数、批大小和学习率。3.根据权利要求1所述的传染病流行期间短期电力负荷预测方法,其特征在于,所述预测精度为平均绝对百分比误差。4.根据权利要求1所述的传染病流行期间短期电力负荷预测方法,其特征在于,所述在训练中以深度强化学习来确定所述迁移深度学习模型共享权重层的最优超参数,还包括:将深度强化学习遍历过的状态及其对应的q值作为训练集,训练极端梯度提升机;使用训练后的极端梯度提升机预测未被深度强化学习遍历过的状态的q值,选取最大q值所对应的状态,作为所述超参数的最优值。5.根据权利要求1所述的传染病流行期间短期电力负荷预测方法,其特征在于,所述权重共享层采用rnn循环神经网络层。6.一种传染病流行期间短期电力负荷预测装置,包括处理器以及存储有若干计算机指令的存储器,其特征在于,所述计算机指令被处理器执行时实现权利要求1至权利要求5中任意一项所述方法的步骤。

技术总结
本发明公开了一种传染病流行期间短期电力负荷预测方法及装置,通过构建包括不同地理区域电力负荷数据、时间信息、天气数据和移动数据的知识库,以构建的知识库训练迁移深度学习模型,所述迁移深度学习模型的输入为不同地理区域的时间信息、天气数据和移动数据,所述迁移深度学习模型的输出为不同地理区域的短期电力负荷预测结果,在训练中以深度强化学习来确定所述迁移深度学习模型共享权重层的最优超参数,以训练好的采用最优超参数的迁移深度学习模型进行电力负荷预测。本发明能够提高预测精度,并克服与传染病流行相关的移动数据有限的问题。有限的问题。有限的问题。


技术研发人员:张文宇 陈谦 张帅 王子恒 徐纪元
受保护的技术使用者:浙江财经大学
技术研发日:2022.02.11
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-7336.html

最新回复(0)