基于dae的电潜泵故障诊断方法、系统、终端及介质
技术领域
1.本发明涉及电潜泵故障诊断技术领域,更具体地说,它涉及基于dae的电潜泵故障诊断方法、系统、终端及介质。
背景技术:2.电潜泵(electric submersible pump,esp)举升技术是广泛应用于非自喷高产井和高含水井中。esp系统具有强关联性和多单元的结构特点,esp能够在更高温度和更大深度的条件下把原油从地底抬升到地面来,这就容易导致esp在生产过程种发生故障,从而导致生产中断,造成严重的经济损失。
3.近些年来,传感器的发展使得esp实时生产状况监测变得更加容易,传感器可以按一定时间间隔实时记录esp生产数据,将esp井生产数据进行有效处理分析可以为esp故障诊断提供新的思路。而目前针对泵类设备的故障诊断技术主要是依据泵的运行电压、电流数据进行处理的;一方面,仅依据泵的运行电压、电流数据进行故障诊断的及时性较差;另一方面,没有考虑到esp生产数据和复杂环境对泵类设备故障的影响,泵类设备的故障诊断结果的精确度有待进一步提升。
4.因此,如何研究设计一种能够克服上述缺陷的基于dae的电潜泵故障诊断方法、系统、终端及介质是我们目前急需解决的问题。
技术实现要素:5.为解决现有技术中的不足,本发明的目的是提供基于dae的电潜泵故障诊断方法、系统、终端及介质,结合降噪自编码模型和特征分类模型,可有效预估电潜泵的运行状态,提前判别将发生的电潜泵故障类型,有效提升了故障诊断的及时性。
6.本发明的上述技术目的是通过以下技术方案得以实现的:
7.第一方面,提供了基于dae的电潜泵故障诊断方法,包括以下步骤:
8.实时采集电潜泵生产过程的运行数据;
9.对运行数据进行预处理后提取相关属性特征;
10.通过降噪自编码模型对相关属性特征进行分析,得到相关属性特征中的故障特征;
11.采用特征分类模型对故障特征分类处理,得到故障特征所对应的电潜泵故障类型。
12.进一步的,所述运行数据的预处理包括数据清洗和数据填补;
13.数据清洗包括:当数据中属性的空缺值超过第一空缺率时,删除相应数据中相应列的属性;当数据样本的空缺率超过第二空缺率时,删除相应的数据样本;当特征数据为单一值时,删除相应特征数据;当电潜泵生产时间小于24h时,删除相应的样本数据;
14.数据填补采用线性插值法对空缺的数据进行填补。
15.进一步的,所述相关属性特征的提取过程具体为:
16.以井口温度、井底流压、泵电流和折算日产液量四个变量作为目标变量,分析运行数据中的特征数据与各目标变量之间的最大信息系数;
17.结合皮尔逊相关系数和最大信息系数筛选出相关属性特征。
18.进一步的,所述相关属性特征包括井底流压、折算日产液量、测试液量、日产液量_分配、测试水量、折算日产水量、日产水量_分配、日产气量_分配、日产油量_分配、测试油量、折算日产油量、泵入口温度、含水率_分配、水气比_分配、井口温度、油压、泵电流和泵电压。
19.进一步的,所述降噪自编码模型对相关属性特征的分析过程具体为:
20.将相关属性特征分为待测数据和长期正常数据;
21.将长期正常数据输入降噪自编码模型中,进行预训练和调优后计算得到标准重构值及重构误差范围;
22.将待测数据输入降噪自编码模型中,计算得到待测数据所对应的预测重构值及重构误差范围;
23.将预测重构值及重构误差范围超出标准重构值及重构误差范围所对应的待测数据判断为故障特征。
24.进一步的,所述降噪自编码模型通过预训练和调优后建立七层神经网络:
25.第一层配置有20个编码节点;
26.第二层配置有10个编码节点;
27.第三层配置有5个编码节点;
28.第四层配置有3个编码节点;
29.第五层配置有5个解码节点;
30.第六层配置有10个解码节点;
31.第七层配置有20个解码节点。
32.进一步的,所述特征分类模型配置有svm分类器和gas优化器,电潜泵故障类型包括三项电压不平衡、管柱漏失、过载停泵和欠载停泵四个类型。
33.第二方面,提供了基于dae的电潜泵故障诊断系统,包括:
34.数据采集模块,用于实时采集电潜泵生产过程的运行数据;
35.特征提取模块,用于对运行数据进行预处理后提取相关属性特征;
36.故障分析模块,用于通过降噪自编码模型对相关属性特征进行分析,得到相关属性特征中的故障特征;
37.故障分类模块,用于采用特征分类模型对故障特征分类处理,得到故障特征所对应的电潜泵故障类型。
38.第三方面,提供了一种计算机终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面中任意一项所述的基于dae的电潜泵故障诊断方法。
39.第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现如第一方面中任意一项所述的基于dae的电潜泵故障诊断方法。
40.与现有技术相比,本发明具有以下有益效果:
41.1、本发明提出的基于dae的电潜泵故障诊断方法,结合降噪自编码模型和特征分
类模型,可有效预估电潜泵的运行状态,提前判别将发生的电潜泵故障类型,有效提升了故障诊断的及时性;
42.2、本发明针对电潜泵的运行数据进行数据清洗和数据填补处理,并对详细处理方式优化设计,即可有效降低对后续处理分析的干扰,同时保证了相关属性特征提取的合理性与可靠性;
43.3、本发明考虑了esp生产数据和复杂环境对泵类设备故障的影响,并结合泵电流和泵电压,能够有效同时泵类设备的故障诊断结果的精确度,同时进一步提升故障诊断的及时性;
44.4、本发明依据相关属性特征的类别和数量对降噪自编码模型的神经网络结构进行优化设计,能够准确、可靠的识别出异常数据;
45.5、本发明将svm分类器和gas优化器结合建立的特征分类模型,能够明显提升整个模型的准确率。
附图说明
46.此处所说明的附图用来提供对本发明实施例的进一步理解,构成本技术的一部分,并不构成对本发明实施例的限定。在附图中:
47.图1是本发明实施例中的故障分析流程图;
48.图2是本发明实施例中的四种插值效果图;
49.图3是本发明实施例中最大信息系数的计算结果示意图,a为折算日产液量与每一变量的mic相关系数,b为井口温度与每一变量的mic相关系数,c为井底流压与每一变量的mic相关系数,d为泵电流与每一变量的mic相关系数;
50.图4是本发明实施例中降噪自编码模型的训练结果示意图;
51.图5是本发明实施例中故障诊断结果示意图;
52.图6是本发明实施例中特征分类模型的工作原理图;
53.图7是本发明实施例中gas适应度示意图;
54.图8是本发明实施例中的系统框图。
具体实施方式
55.为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
56.实施例1:基于dae的电潜泵故障诊断方法,如图1所示,具体由以下步骤实现。
57.一、数据采集
58.通过传感器实时采集电潜泵生产过程的运行数据,也可从数据采集与监视控制系统(scada)、数据库等调取检测数据,为后续步骤提供数据支撑。
59.二、数据清洗
60.检测系统、传感器会因一些非人为因素,所收集的数据出现一些缺失或者异常值,需要对数据进行数据清洗。
61.在本实施例中,当数据中属性的空缺值超过90%时,删除相应数据中相应列的属
性,第一空缺率还可根据需求设置为其他占比。当数据样本的空缺率超过90%时,删除相应的数据样本,第二空缺率还可根据需求设置为其他占比。当特征数据为单一值时,删除相应特征数据,例如表层套压、技术套压等变量,这些变量对数据没有影响,反而会增加实验运行时间。当电潜泵生产时间小于24h时,删除相应的样本数据,如表1所示。
62.表1生产时间不到24小时
[0063][0064]
三、数据填补
[0065]
插值方法一般包括反距离加权插值法、牛顿插值法、线性插值法、随机森林填补法。以“831352627”井为例进行实验,四种插值效果见图2所示。
[0066]
通过欧氏距离计算各种插值算法的插入数据与变量之间的距离进行比较,如表2所示,其中,以线性插值为数据的插值方法对于本技术中考虑了esp生产数据和复杂环境对泵类设备故障的影响的运行数据来说,效果更好。所以数据填补采用线性插值法对空缺的数据进行填补。
[0067]
表2四种插值距离结果的欧氏距离
[0068][0069]
四、特征提取
[0070]
电潜泵数据属性特征较多,有些特征对研究电潜泵故障是没有意义的,会对后续的数据研究产生负向影响,因此需要进行特征选取,对比不同的的方法选取特征,见表3所示。电潜泵数据有着样本多,属性复杂的特点,选取计算复杂度不高,且有较高鲁棒性的方法。
[0071][0072]
选出以井口温度、井底流压、泵电流和折算日产液量四个变量作为目标变量,四个不同的指标,需要较高的鲁棒性;电潜泵数据样本量大,需要计算较为简单,节省运行时间的算法。分析其它特征与各自之间最大信息系数。有以下4个结果,如图3所示。
[0073]
为此,在本实施例中,相关属性特征的提取过程具体为:以井口温度、井底流压、泵电流和折算日产液量四个变量作为目标变量,分析运行数据中的特征数据与各目标变量之间的最大信息系数;结合皮尔逊相关系数和最大信息系数筛选出相关属性特征。
[0074]
相关属性特征包括井底流压、折算日产液量、测试液量、日产液量_分配、测试水量、折算日产水量、日产水量_分配、日产气量_分配、日产油量_分配、测试油量、折算日产油量、泵入口温度、含水率_分配、水气比_分配、井口温度、油压、泵电流和泵电压。
[0075]
五、故障分析
[0076]
从表4所展示的数据中可以看出“泵电压”的数值普遍较大,相对于“油压”大了百倍以上,这就需要我们进行归一化、标准化处理,为模型训练提供数据支撑。
[0077]
表4电潜泵部分数据
[0078][0079]
自动编码器是一类人工神经网络,它以无监督的方式学习高效的数据值编码。自动编码器的目的是学习一组数据的表达(编码),通常用于降维。解码器和编码器都会学习,这样自动编码器尝试从降维后的编码中生成尽可能接近其原始输入的表达。降噪自编码器(denoising autoencoder,dae),它的核心思想是对原始数据中进行腐蚀,dae克服这些破坏,进行编码和解码操作,重构出原始数据,可以提取出更具稳定性的特征。
[0080]
针对本发明所选取的数据类型较多,选取以自动编码器构建的降噪自编码模型进行数据分析,如图1所示,降噪自编码模型对相关属性特征的分析过程具体为:将相关属性特征分为待测数据和长期正常数据;将长期正常数据输入降噪自编码模型中,进行预训练和调优后计算得到标准重构值及重构误差范围;将待测数据输入降噪自编码模型中,计算
得到待测数据所对应的预测重构值及重构误差范围;将预测重构值及重构误差范围超出标准重构值及重构误差范围所对应的待测数据判断为故障特征。
[0081]
在本实施例中,降噪自编码模型通过预训练和调优后建立七层神经网络:第一层配置有20个编码节点;第二层配置有10个编码节点;第三层配置有5个编码节点;第四层配置有3个编码节点;第五层配置有5个解码节点;第六层配置有10个解码节点;第七层配置有20个解码节点。
[0082]
如图4所示,从以上述降噪自编码模型进行分析的训练结果,可以看出训练损失和验证损失在epochs约为250时趋于平稳,且训练集并没有出现“反弹”,也就是没有过拟合的现象。
[0083]
如图5所示,可以看出上述故障分析明显地区分了正常数据和故障数据,起到监测故障的作用。水平线以下为健康数据,以上为异常数据,说明机器已经出现异常,但未必人工能识别出来。
[0084]
六、当监测到机器异常时,需要对故障进行故障识别,方便技术人员故障维修等,降低维修成本,减少维修风险。
[0085]
在本实施例中,电潜泵故障类型包括三项电压不平衡、管柱漏失、过载停泵和欠载停泵四个类型。通过对比多种分类模型,“svm”、“决策树”、“softmax”、“xgboost”、“贝叶斯分类器”,见表5所示。
[0086]
表5模型对比
[0087][0088]
通过对比可得,改进的多分类svm模型有着较高模型精度,同时利用遗传算(ga)对模型进一步调参,使得模型有着更加精准的准确率。
[0089]
如图6所示,svm分类器与gas优化器结合构建的处理流程包括:确定svm模型,初始化svm中的参数,gas对初始值编码,结合gas优化器的数据预处理结果、svm训练得到的误差做适应度值,选择、交叉、变异操作,计算适应度值,得到最优参数,得到故障分类。
[0090]
如图7所示,在本实施例中,种群最好的参数值和最优适应度函数值为[8.069773385747773,0.12224313967837981],最终调优的结果达到97.35%。
[0091]
实施例2:基于dae的电潜泵故障诊断系统,该系统用于实现实施例1中记载的方法,如图8所示,包括数据采集模块、特征提取模块、故障分析模块和故障分类模块。
[0092]
其中,数据采集模块,用于实时采集电潜泵生产过程的运行数据;特征提取模块,用于对运行数据进行预处理后提取相关属性特征;故障分析模块,用于通过降噪自编码模型对相关属性特征进行分析,得到相关属性特征中的故障特征;故障分类模块,用于采用特征分类模型对故障特征分类处理,得到故障特征所对应的电潜泵故障类型。
[0093]
工作原理:本发明结合降噪自编码模型和特征分类模型,可有效预估电潜泵的运行状态,提前判别将发生的电潜泵故障类型,有效提升了故障诊断的及时性;且针对电潜泵的运行数据进行数据清洗和数据填补处理,并对详细处理方式优化设计,即可有效降低对后续处理分析的干扰,同时保证了相关属性特征提取的合理性与可靠性;此外,考虑了esp生产数据和复杂环境对泵类设备故障的影响,并结合泵电流和泵电压,能够有效同时泵类设备的故障诊断结果的精确度,同时进一步提升故障诊断的及时性;另外,依据相关属性特
征的类别和数量对降噪自编码模型的神经网络结构进行优化设计,能够准确、可靠的识别出异常数据;还有,将svm分类器和gas优化器结合建立的特征分类模型,能够明显提升整个模型的准确率。
[0094]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0095]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0096]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0097]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0098]
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:1.基于dae的电潜泵故障诊断方法,其特征是,包括以下步骤:实时采集电潜泵生产过程的运行数据;对运行数据进行预处理后提取相关属性特征;通过降噪自编码模型对相关属性特征进行分析,得到相关属性特征中的故障特征;采用特征分类模型对故障特征分类处理,得到故障特征所对应的电潜泵故障类型。2.根据权利要求1所述的基于dae的电潜泵故障诊断方法,其特征是,所述运行数据的预处理包括数据清洗和数据填补;数据清洗包括:当数据中属性的空缺值超过第一空缺率时,删除相应数据中相应列的属性;当数据样本的空缺率超过第二空缺率时,删除相应的数据样本;当特征数据为单一值时,删除相应特征数据;当电潜泵生产时间小于24h时,删除相应的样本数据;数据填补采用线性插值法对空缺的数据进行填补。3.根据权利要求1所述的基于dae的电潜泵故障诊断方法,其特征是,所述相关属性特征的提取过程具体为:以井口温度、井底流压、泵电流和折算日产液量四个变量作为目标变量,分析运行数据中的特征数据与各目标变量之间的最大信息系数;结合皮尔逊相关系数和最大信息系数筛选出相关属性特征。4.根据权利要求1所述的基于dae的电潜泵故障诊断方法,其特征是,所述相关属性特征包括井底流压、折算日产液量、测试液量、日产液量_分配、测试水量、折算日产水量、日产水量_分配、日产气量_分配、日产油量_分配、测试油量、折算日产油量、泵入口温度、含水率_分配、水气比_分配、井口温度、油压、泵电流和泵电压。5.根据权利要求1所述的基于dae的电潜泵故障诊断方法,其特征是,所述降噪自编码模型对相关属性特征的分析过程具体为:将相关属性特征分为待测数据和长期正常数据;将长期正常数据输入降噪自编码模型中,进行预训练和调优后计算得到标准重构值及重构误差范围;将待测数据输入降噪自编码模型中,计算得到待测数据所对应的预测重构值及重构误差范围;将预测重构值及重构误差范围超出标准重构值及重构误差范围所对应的待测数据判断为故障特征。6.根据权利要求5所述的基于dae的电潜泵故障诊断方法,其特征是,所述降噪自编码模型通过预训练和调优后建立七层神经网络:第一层配置有20个编码节点;第二层配置有10个编码节点;第三层配置有5个编码节点;第四层配置有3个编码节点;第五层配置有5个解码节点;第六层配置有10个解码节点;第七层配置有20个解码节点。7.根据权利要求1所述的基于dae的电潜泵故障诊断方法,其特征是,所述特征分类模
型配置有svm分类器和gas优化器,电潜泵故障类型包括三项电压不平衡、管柱漏失、过载停泵和欠载停泵四个类型。8.基于dae的电潜泵故障诊断系统,其特征是,包括:数据采集模块,用于实时采集电潜泵生产过程的运行数据;特征提取模块,用于对运行数据进行预处理后提取相关属性特征;故障分析模块,用于通过降噪自编码模型对相关属性特征进行分析,得到相关属性特征中的故障特征;故障分类模块,用于采用特征分类模型对故障特征分类处理,得到故障特征所对应的电潜泵故障类型。9.一种计算机终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现如权利要求1-7中任意一项所述的基于dae的电潜泵故障诊断方法。10.一种计算机可读介质,其上存储有计算机程序,其特征是,所述计算机程序被处理器执行可实现如权利要求1-7中任意一项所述的基于dae的电潜泵故障诊断方法。
技术总结本发明公开了基于DAE的电潜泵故障诊断方法、系统、终端及介质,涉及电潜泵故障诊断技术领域,其技术方案要点是:实时采集电潜泵生产过程的运行数据;对运行数据进行预处理后提取相关属性特征;通过降噪自编码模型对相关属性特征进行分析,得到相关属性特征中的故障特征;采用特征分类模型对故障特征分类处理,得到故障特征所对应的电潜泵故障类型。本发明结合降噪自编码模型和特征分类模型,可有效预估电潜泵的运行状态,提前判别将发生的电潜泵故障类型,有效提升了故障诊断的及时性。有效提升了故障诊断的及时性。有效提升了故障诊断的及时性。
技术研发人员:李升 杨培浩 陈家锐 林慧贤 李镇涛 王江颖
受保护的技术使用者:广东海洋大学
技术研发日:2022.03.16
技术公布日:2022/7/5