本技术涉及智能调度,特别是涉及一种多充电站协同调度方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着电动汽车的迅速普及,充电站的需求量大幅增加,这促使了充电站的快速增长。然而,由于用户行为的不确定性和充电站服务能力的异质性,在合作充电站的情景下,各个充电站之间需要进行协调,同时满足电动汽车用户的需求。
2、目前,对于合作充电站的调度管理,相关技术通常假设用户行为是静态和确定的,未能充分考虑到用户行为的动态变化和不确定性,存在局限性。传统的优化方法,如线性规划和混合整数规划,可以在一定程度上优化调度方案。
3、但相关方法往往需要已知所有的系统参数,并且计算复杂度较高,难以实时应用于大规模充电站网络,仍然依赖于基于规则的调度策略,缺乏灵活性,难以适应实际运营中的复杂情况。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高充电站调度灵活性的多充电站协同调度方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种多充电站协同调度方法,包括:
3、获取每一个所述充电站和所述充电站对应的多个用电主体的当前状态信息和状态转换信息;其中,所述状态转换信息用于表征,在所述用电主体使用所述充电站的情况下,所述充电站和所述用电主体的状态信息变更情况;
4、根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据;
5、将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,其中,所述匹配决策模型是根据所述充电站的历史状态信息和历史调度数据训练得到的;
6、根据所述调度匹配结果调度相匹配的所述充电站对所述用电主体进行充电。
7、在其中一个实施例中,所述匹配决策模型包括参数构建子模型和调度决策子模型;所述将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,包括:
8、将所述当前状态信息、所述状态转换信息和所述选择概率数据输入所述参数构建子模型,得到奖励参数和惩罚参数;
9、根据所述奖励参数和所述惩罚参数,使用所述调度决策子模型计算不同供电组合的总奖励值;
10、选取所述总奖励值大于预设奖励阈值的所述供电组合,以得到调度匹配结果。
11、在其中一个实施例中,所述供电组合是一个所述用电主体与一个所述充电站的组合,或是一个所述用电主体和多个所述充电站的组合;所述根据所述奖励参数和所述惩罚参数,使用所述调度决策子模型计算不同供电组合的总奖励值,包括:
12、获取预设惩罚因子阈值;
13、在所述惩罚参数不小于所述预设惩罚因子阈值的情况下,根据所述奖励参数和所述惩罚参数,使用所述调度决策子模型计算不同供电组合的总奖励值。
14、在其中一个实施例中,所述选取所述总奖励值大于预设奖励阈值的所述供电组合,以得到调度匹配结果,包括:
15、针对每个所述总奖励值大于预设奖励阈值的所述供电组合,根据对应的所述当前状态信息,确定所述充电站的充电率、所述用电主体的充电时限和剩余充电需求数据;
16、根据所述充电率、所述充电时限和所述剩余充电需求数据,分别计算不同所述供电组合的宽松度数据;
17、根据所述宽松度数据确定选取优先级,并根据所述选取优先级选定所述供电组合作为调度匹配结果。
18、在其中一个实施例中,所述当前状态信息包括当前位置信息和固定属性信息;所述根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据,包括:
19、根据所述用电主体的所述当前位置信息和所述充电站的所述当前位置信息计算充电距离数据;
20、根据所述固定属性信息确定吸引力数据;
21、根据所述充电距离数据和所述吸引力数据计算选择概率数据。
22、在其中一个实施例中,所述根据所述充电距离数据和所述吸引力数据计算选择概率数据,包括:
23、根据所述充电距离数据和所述吸引力数据计算充电效用数据;
24、计算所述充电效用数据占供电系统总效用数据的比例,得到选择概率数据。
25、第二方面,本技术还提供了一种多充电站协同调度装置,包括:
26、信息获取模块,用于获取每一个所述充电站和所述充电站对应的多个用电主体的当前状态信息和状态转换信息;其中,所述状态转换信息用于表征,在所述用电主体使用所述充电站的情况下,所述充电站和所述用电主体的状态信息变更情况;
27、概率计算模块,用于根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据;
28、主体匹配模块,用于将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,其中,所述匹配决策模型是根据所述充电站的历史状态信息和历史调度数据训练得到的;
29、调度模块,用于根据所述调度匹配结果调度相匹配的所述充电站对所述用电主体进行充电。
30、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
31、获取每一个所述充电站和所述充电站对应的多个用电主体的当前状态信息和状态转换信息;其中,所述状态转换信息用于表征,在所述用电主体使用所述充电站的情况下,所述充电站和所述用电主体的状态信息变更情况;
32、根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据;
33、将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,其中,所述匹配决策模型是根据所述充电站的历史状态信息和历史调度数据训练得到的;
34、根据所述调度匹配结果调度相匹配的所述充电站对所述用电主体进行充电。
35、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
36、获取每一个所述充电站和所述充电站对应的多个用电主体的当前状态信息和状态转换信息;其中,所述状态转换信息用于表征,在所述用电主体使用所述充电站的情况下,所述充电站和所述用电主体的状态信息变更情况;
37、根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据;
38、将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,其中,所述匹配决策模型是根据所述充电站的历史状态信息和历史调度数据训练得到的;
39、根据所述调度匹配结果调度相匹配的所述充电站对所述用电主体进行充电。
40、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
41、获取每一个所述充电站和所述充电站对应的多个用电主体的当前状态信息和状态转换信息;其中,所述状态转换信息用于表征,在所述用电主体使用所述充电站的情况下,所述充电站和所述用电主体的状态信息变更情况;
42、根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据;
43、将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,其中,所述匹配决策模型是根据所述充电站的历史状态信息和历史调度数据训练得到的;
44、根据所述调度匹配结果调度相匹配的所述充电站对所述用电主体进行充电。
45、上述多充电站协同调度方法、装置、计算机设备、存储介质和计算机程序产品,通过获取每一个充电站和充电站对应的多个用电主体的当前状态信息和状态转换信息,得到在用电主体使用充电站的情况下,充电站和用电主体的状态信息变更情况,再根据当前状态信息计算用电主体使用充电站的选择概率数据,从而能够动态捕捉用电主体选择充电站的行为模式,根据实时数据进行调整,再将当前状态信息、状态转换信息和选择概率数据输入根据充电站的历史状态信息和历史调度数据训练得到的匹配决策模型,得到调度匹配结果,从而能够在动态环境中进行充电站自适应调度规划,根据调度匹配结果调度相匹配的充电站对用电主体进行充电,考虑了用电主体行为的动态变化和不确定性,从而能够提高充电站调度灵活性。
1.一种多充电站协同调度方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述匹配决策模型包括参数构建子模型和调度决策子模型;所述将所述当前状态信息、所述状态转换信息和所述选择概率数据输入匹配决策模型,得到调度匹配结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述供电组合是一个所述用电主体与一个所述充电站的组合,或是一个所述用电主体和多个所述充电站的组合;所述根据所述奖励参数和所述惩罚参数,使用所述调度决策子模型计算不同供电组合的总奖励值,包括:
4.根据权利要求2所述的方法,其特征在于,所述选取所述总奖励值大于预设奖励阈值的所述供电组合,以得到调度匹配结果,包括:
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述当前状态信息包括当前位置信息和固定属性信息;所述根据所述当前状态信息计算所述用电主体使用所述充电站的选择概率数据,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述充电距离数据和所述吸引力数据计算选择概率数据,包括:
7.一种多充电站协同调度装置,其特征在于,所述装置包括:
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。