一种基于用户行为模式聚类的电力客户诉求热点分析方法及系统与流程

allin2025-06-25  58


本发明属于电力数据检测领域,具体涉及一种基于用户行为模式聚类的电力客户诉求热点分析方法及系统。


背景技术:

1、随着人工智能技术日新月异的进步与电网智能化改革的逐步深化,用户侧数据持续累积,现代电力系统已步入了大数据的时代;为了高效的进行基于负荷数据挖掘的电力客户诉求分析,采用优化特征提取和聚类的方法对用户曲线进行高效特征提取和精准模式划分,从纷繁复杂的负荷数据中提炼出典型的用户行为模式,进而分析不同客户类别的电力诉求;有助于电网工作人员深入剖析用户用电模式,构建精细化的用户画像,了解用户用电诉求,为不同用户提供更加精准的管理和个性化的服务,从而推动电力系统的优化与升级。

2、相比于pca等降维算法,umap算法更擅长捕捉高维数据中的非线性结构,有助于更好的保留数据的关联性和结构信息,以更好的表示用户用电负荷特征。变异系数法是一种客观赋权法,采用统计学方法计算各指标相对于总体的变异程度,根据这种变异程度判断权重。若两个特征之间的关联性很强,则应该适当减少权重,反之则增加权重;通过回归分析等算法进行计算特征之间的相关系数;通过对低维特征加权,可以提高特征对聚类的贡献度,k-means聚类算法,是目前研究应用的主流方法之一,属于无监督学习算法的一种;无论在复杂的信号样本、文字为载体的文本或者图片领域的辨识都具有较好的聚类效果,处理大规模数据时也具有较好的效果,算法简单,快速,算法时间复杂度为,其中为样本数目,为聚类簇数,为迭代次数;k-means聚类分析的应用,具体是对电力负荷样本构造多数据特征,然后分类划分成不同的数据组合;电力负荷曲线作为反映用电行为的数据表征之一,其曲线在一定程度上刻画数据结构特点和用电规律,进一步分析电力客户诉求。

3、cn202311304193.5a公开了一种基于改进fa-k-means算法的配电网负荷集群划分方法,包括:建立lstm神经网络的负荷预测模型进行配电网负荷预测,得到负荷预测值;计算电气距离度指标和综合指标;改进萤火虫算法的吸引度公式,优化位置更新,得到改进的萤火虫算法;寻优k-means算法初始中心;利用改进的k-means算法结合最优初始中心,对配电网负荷集群划分求解,实现配电网负荷集群划分。该专利的k-means未选取最佳的聚类中心,会导致k-means算法运行时使聚类结果存在着很大的不稳定性,导致算法处理数据时会出现准确率降低、收敛速度慢等问题。

4、cn202310922201 .6a公开了基于多元负荷聚类的园区能源分配方法及系统,方法包括获取园区能源系统的多元负荷数据,将多元负荷数据进行清洗降维处理,获得负荷数据集;根据预设随机密度选取规则,在负荷数据集中选取初代萤火虫个体,将初代萤火虫个体作为当前聚类中心进行fcm聚类,获得初始聚类结果;根据初始聚类结果和适应度函数,计算各萤火虫亮度,迭代更新萤火虫位置,获得最优初始聚类中心,将最优初始聚类中心作为当前聚类中心进行fcm聚类,获得最优负荷聚类结果;根据最优负荷聚类结果,计算多元负荷耦合特性指标,对园区能源系统的能源进行分配。该专利未关注高维度数据电网的处理。


技术实现思路

1、为解决现有技术中存在的不足,本发明提供一种基于用户行为模式聚类的电力客户诉求热点分析方法,用umap降维算法并结合变异系数法对低维特征进行加权,构建联合参数指标以选取最佳聚类初值,在传统k-means基础上引入改进fa(萤火虫算法)优化聚类中心的选择。

2、本发明采用如下的技术方案。

3、一种基于用户行为模式聚类的电力客户诉求热点分析方法,所述方法包括以下步骤:

4、步骤1:获取用户负荷数据,并对获取的用户负荷数据进行预处理,来构建负荷数据集;

5、步骤2:对步骤1构建的负荷数据集进行降维构成低维数据集,并对低维数据集中的数据特征进行加权,来构建负荷特征集;

6、步骤3:基于sse指标和簇内离散度构建联合参数指标,选取聚类算法的初始聚类簇数;

7、步骤4:基于步骤3确定的聚类算法的初始聚类簇数,对萤火虫算法进行改进,来优化聚类算法初始中心的确定;

8、步骤5:根据步骤4确定的聚类算法初始中心和步骤2构建的负荷特征集,来构建聚类分析模型,划分不同的电力客户,从而识别不同的客户需求。

9、本发明还包括以下优选方案:

10、步骤1中,用户负荷数据包括用户用电时段、最大负荷、最小负荷、平均负荷以及有功功率。

11、步骤1中,对获取的用户负荷数据进行预处理包括删除无效值、离群值以及填补空缺值。

12、步骤2中,对低维数据集中的数据特征进行加权包括:

13、计算每一项数据特征的均值和标准差;

14、计算每一项数据特征的变异系数并对各变异系数进行归一化处理,将各归一化处理后的变异系数作为对应数据特征的权重。步骤3中,初始聚类簇数按如下公式进行确定:

15、,

16、其中,表示聚类初始簇数、表示的联合参数指标、表示不同值下簇内点与所在簇中心的距离平方和,表示不同值下簇内点与数据集中心的距离平方和、表示聚类初值k的误差平方和、表示聚类初值的误差平方和、表示聚类初值的误差平方和,通过计算不同值对应的来确定初始聚类簇数值。

17、在步骤4中,对萤火虫算法进行改进,来优化聚类算法确定的初始中心包括按如下公式定义萤火虫算法中的扰动项:

18、,

19、其中,分别表示迭代次数和最大迭代次数,为常数。

20、步骤4中,对萤火虫算法进行改进,来优化聚类算法确定的初始中心还包括:

21、按如下公式更新萤火虫公式中的指数运算:

22、,

23、其中,表示光强吸收系数,为常数,表示被吸引的萤火虫与光源萤火虫的距离。

24、在步骤5中,根据步骤4确定的聚类算法初始中心和步骤2构建的负荷特征集,来构建聚类分析模型包括:

25、步骤s501:初始化萤火虫算法的初始值;

26、步骤s502:采用密度参数法选取初代个体;

27、步骤s503:将步骤s502选取的初代个体代入萤火虫算法,进行迭代和个体移动,直到达到设定的迭代次数,输出最优个体;

28、步骤s504:将步骤s503求得的最优个体代入聚类模型,获得聚类结果。

29、步骤s501中,萤火虫算法的初始值包括光源萤火虫当前位置吸引度、光强吸收系数以及被吸引萤火虫被吸引与光源萤火虫的距离。

30、步骤s502中,采用随机法和密度参数法选取初代个体包括:从n个负荷数据集中随机选取k个初始中心作为一个初代个体,共选择n-1个初代个体;采用密度参数法选取最佳的k个最优初始中心作为一个优秀个体;n-1个初代个体和k个最优初始中心组成萤火虫初代种群。

31、密度参数法选取最佳的k个最优初始中心包括按如下公式计算负荷曲线的参数密度:

32、,

33、其中,表示负荷数据集平均距离,表示第个用户的用户数据、表示第个用户的用户数据,表示与的欧式距离,根据上式找到负荷曲线的密度最大值,并为密度最大的负荷曲线对应的负荷数据集选取为一个初始中心,将离确定的初始中心距离等于的数据删除,重新计算新的负荷数据集中的初始中心,直到选出k个最优初始中心。

34、同时,本发明还提供一种基于用户行为模式聚类的电力客户诉求热点分析系统,系统包括数据获取模块、负荷特征集构建模块、聚类簇数确定模块、模型构建模块;

35、所述数据获取模块,用于获取用户负荷数据,并对获取的用户负荷数据进行预处理,来构建负荷数据集;

36、所述负荷特征集构建模块,用于数据获取模块构建的负荷数据集进行降维构成低维数据集,并对低维数据集中的数据特征进行加权,来构建负荷特征集;

37、所述聚类簇数确定模块,用于基于sse指标和簇内离散度构建联合参数指标选取聚类算法的初始聚类簇数;

38、所述模型构建模块,用于基于聚类簇数确定模块确定的聚类算法的初始聚类簇数,对萤火虫算法进行改进,来优化聚类算法初始中心的确定;并根据确定的聚类算法初始中心和负荷特征集构建模块构建的负荷特征集,来构建聚类分析模型,划分不同的电力客户,从而识别不同的客户需求。

39、一种终端,包括处理器及存储介质; 所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行任一项所述方法的步骤。

40、计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述方法的步骤。

41、本发明的有益效果在于,与现有技术相比,本发明采用umap降维算法并结合变异系数法对低维特征进行加权,有助于更全面地提取原始数据的信息,获得更利于聚类模型的负荷特征集;由于随机选取聚类初始值会影响聚类效率和结果,本发明构建联合参数指标以选取最佳聚类初值,使到达最佳聚类数点,优化了聚类效果;本发明在传统k-means基础上引入改进fa(萤火虫算法)优化聚类中心的选择,防止算法过早收敛于局部最优解,以提高算法的收敛速度和稳定性;通过聚类模型提取用户行为模式,根据不同的用户模式和用电规律,对电力客户可能存在的诉求进行分析,有助于电网管理及提供个性化的服务。


技术特征:

1.一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

3.根据权利要求1所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

4.根据权利要求1所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

5.根据权利要求1所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

6.根据权利要求1所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

7.根据权利要求1或6所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

8.根据权利要求1所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

9.根据权利要求8所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

10.根据权利要求8所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

11.根据权利要求10所述的一种基于用户行为模式聚类的电力客户诉求热点分析方法,其特征在于:

12.一种利用权利要求1-11任一项权利要求所述方法的一种基于用户行为模式聚类的电力客户诉求热点分析系统,系统包括数据获取模块、负荷特征集构建模块、聚类簇数确定模块、模型构建模块,其特征在于:

13.一种终端,包括处理器及存储介质;其特征在于:

14.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-11任一项所述方法的步骤。


技术总结
一种基于用户行为模式聚类的电力客户诉求热点分析方法及系统,包括:获取用户负荷数据,并对用户负荷数据进行预处理,构建负荷数据集;对负荷数据集进行降维构成低维数据集,并对低维数据集中的数据特征进行加权,构建负荷特征集;基于SSE指标和簇内离散度构建联合参数指标,选取聚类算法的初始聚类簇数;对萤火虫算法进行改进,来优化聚类算法初始中心的确定;根据确定的聚类算法初始中心和构建的负荷特征集,来构建聚类分析模型。本发明通过对电力客户负荷特征的优化提取和聚类分析过程的改进,使用台区实测电力客户负荷数据进行算例分析,提取用户行为模型,有助于电力公司进行对不同类别电力客户的个性化管理。

技术研发人员:吴明,康雨萌,何玮,周雨奇,钱旭盛,周玉,张昕,侯玉涛,桂均
受保护的技术使用者:国网江苏省电力有限公司营销服务中心
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-22527.html

最新回复(0)