一种基于判别特征聚类分析的异常监测方法及装置

allin2026-05-16  8


本发明涉及数据驱动的异常监测,特别涉及一种基于判别特征聚类分析的异常监测方法及装置。


背景技术:

1、以流程工业为代表的化工过程因其规模的大型化与操作的复杂化趋势,对化工过程运行状态进行实时监测从而及时发现生产过程中的异常操作或状态的重要性已不亚于化工产品生产本身。发展至今,基于化工过程精确机理模型的状态监测方法由于现代化工过程大型化与复杂化趋势而遇到了发展的瓶颈。相比之下,数据驱动的化工过程状态监测方法技术已呈现出百花齐放的峥嵘景象。在现有的科技文献与专利技术中,以统计特征学习算法为核心的多变量统计过程监测方法体系已受到众多研究学者的青睐,其基本思想都是通过化工过程正常运行状态下的样本数据实施特征分析后,再对提取的特征和模型误差建立合适的统计指标来实施实时的运行状态监测。

2、申请号/专利号为2021102997791的中国发明专利公开了一种基于实时判别型动态特征提取的pta过程异常监测方法,该方法通过对pta过程的实时采样数据即时的实施判别型动态特征提取,再通过对提取的判别型动态特征的监测来反映pta过程是否出现异常。申请号/专利号为202110300826x的中国发明专利针对精馏过程的运行状态监测披露了一种利用在线非线性判别特征分析的异常监测方法,该方法通过对实时采样数据进行在线非线性判别特征分析和提取来实现对精馏过程的异常监测。然而,这类方法虽可以利用实时的判别特征进行异常检测,但却要求实时在线进行特征值问题的求解,这就要求硬件实现需具备极高的计算效率才能及时响应化工过程高频率的采样数据。

3、发表于《processes》期刊上的一篇标题为fault detection method based onglobal-local marginal discriminant preserving projection for chemical process的论文中提出了一种使用全局和局部判别特征进行异常检测的方法,但该方法需要使用多种故障或异常工况下的样本数据用于训练得到相应全局和局部判别特征。然而,化工过程绝大多数时候处于正常运行状态,可用于模型训练的采样数据都来自于正常工况,一般情况下很难获取不同故障或异常工况下的采样数据用于模型训练。因此,该论文中的方法应用场景是非常受限的。

4、正是由于可用于模型训练的数据都是正常运行状态下采集到的样本数据,实施数据驱动的异常监测还是得对正常运行工况下的数据进行特征分析提取。由于模型训练过程中缺少了故障或异常状态下的样本数据的监督,需要全方位的分析挖掘正常工况的样本数据的变化特征,从而全面的定义出正常工况样本数据可能的变化特征,只有这样才能应对各式各样的故障数据的异常变化,进而保证异常监测的全面性和可靠性。而现有专利技术和科研文献中提供的解决方案多是关注于某一方面的特征分析提取,因此现有的数据驱动的异常监测方法还有待进一步的改进和完善。


技术实现思路

1、本发明所要解决的主要技术问题是:如何全方面的分析提取化工过程正常运行时采样数据的变化特征,从各个采样数据正常判别特征的角度对正常运行工况的采样数据可能存在的变化特征进行提取,从而实现有效且可靠的异常监测。

2、本发明方法解决上述问题所采用的技术方案为:一种基于判别特征聚类分析的异常监测方法,包括以下所示步骤1至步骤5。

3、步骤1、从化工过程正常运行的历史采样数据库中,至少获取500组采样数据,再对各组采样数据实施标准化处理后,按列组成数据矩阵x。

4、步骤2、对数据矩阵x实施判别特征聚类分析,得到用于计算异常指标的中间矩阵h和用于识别异常的阈值实施过程依次包括判别特征分析阶段、聚类分析阶段和转换计算阶段。

5、首先,所述判别特征分析阶段的实施过程是:依次设置编号n=1,2,…,n,并同时实施列向量zn与参考矩阵zn之间的判别分析得到相应的判别向量wn,从而最终得到n个判别向量w1,w2,…,wn;其中,zn表示所述x中的第n列向量,zn表示由所述x中除第n列向量之外的列向量组成的参考矩阵,n为所述x中列向量的总数。

6、其次,所述聚类分析阶段的实施过程包括:先设置聚类簇的个数等于k后,再利用均值聚类算法对n个判别向量w1,w2,…,wn实施聚类,得到k个聚类簇的中心向量c1,c2,…,ck;在实施聚类的过程中,依据公式sn,k=|wntck|计算各个判别向量与各个中心向量之间的隶属度,依次通过公式和来更新第k个聚类簇的中心向量ck;其中,k为一个小于n/2的正整数,sn,k表示wn与ck之间的隶属度,jk表示第k个聚类簇归属的判别向量的总数,表示第k个聚类簇归属的第j个判别向量,sign()表示符号函数,聚类簇编号k=1,2,…,k,编号j=1,2,…,jk。

7、最后,所述转换计算阶段的实施过程包括以下所示步骤2-1至步骤2-3。

8、步骤2-1、将所述k个聚类簇的中心向量c1,c2,...,ck合并成特征转换矩阵c=[c1,c2,…,ck]后,再依次通过公式u=ctx、p=xut(uut)-1、g=i-pct和λ=uut/(n-1)分别计算得分矩阵u、载荷矩阵p、误差生成矩阵g和协方差矩阵λ。

9、步骤2-2、设置权重系数ζu和ζe后,根据公式h=cλ-1ct/ζu+ggt/ζe计算中间矩阵h。

10、步骤2-3、根据公式φ=diag{xthx}计算异常指标向量φ后,根据φ中所有元素的平均值a和标准差b,确定用于识别异常的阈值

11、步骤3、获取最新采样时刻t的一组采样数据,再对其实施标准化处理,从而得到最新采样时刻t的数据向量xt。

12、步骤4、依据公式计算最新采样时刻t的异常指标后,再判断是否满足条件若是,则所述化工过程对象在最新采样时刻t运行正常,返回步骤3继续实施异常监测;若否,则执行步骤5。

13、步骤5、返回步骤3继续利用最新采样时刻的一组采样数据实施异常监测,直至得到至少6个最新采样时刻的异常指标,若它们都大于阈值则触发异常警报;反之,则化工过程运行正常,返回步骤3继续实施异常监测。

14、由于上述判别特征分析阶段的核心任务是实施zn与zn之间的判别分析,对应的判别向量wn表征了训练用的每组正常样本数据相对于其余正常样本数据之间的变化特征;而最终得到的n个判别向量w1,w2,…,wn则全部表征了所有正常样本数据的变化特征,从判别分析的角度全方位的学习提取了化工过程对象正常样本数据可能存在的正常变化特征。

15、在此基础上,对这n个判别向量w1,w2,…,wn实施的聚类分析可以进一步的消除这n个判别向量之间冗余信息,最终使用远小于n个,即k个中心向量进行特征提取(即:步骤2-1中的u=ctx)和误差生成(即:步骤2-1中的g=i-pct),可以有效的减少数据在线实时处理的计算量。

16、由于判别向量wn与中心向量ck的长度都等于1,上述聚类分析阶段中使用的隶属度计算公式实则是考虑到判别向量的方向特性,因此使用向量所表示方向的角度定义的隶属度来判断聚类簇归属的判别向量是更合适的。

17、同样的,聚类分析阶段中更新中心向量ck的方式也是考虑到方向特性,将归属的判别向量的合向量作为中心向量ck的更新,这是为何使用符号函数的缘故。由于符号函数的取值规则是:当时,当时,当时,可以将归属的判别向量按照第k个聚类簇中归属的第1个判别向量的方向进行统一化处理。

18、在上述步骤2-2中通过权重系数将特征转换矩阵和误差生成矩阵以加权的方式结合在一起,直接构成中间矩阵h以提供统一的计算方式,从而方便后续直接计算异常指标。

19、作为本发明公开的异常监测方法的一种改进,实施判别分析时,优选执行如下所示步骤a-1至步骤a-2,以得到对应的判别向量。

20、步骤a-1、设置系数后,根据公式计算矩阵a;其中,所述系数的取值范围是

21、步骤a-2、求解特征值问题aθn=ηnθn中最大特征值ηn对应的特征向量θn后,再根据公式计算得到判别向量wn。

22、为了判别zn和zn之间的正常变化特征差异,通过θn的投影转换实现两个目标,即:和其中等价来讲,就是zn通过θn的投影转换尽可能远离坐标零点,而zn中的正常样本数据通过θn的投影转换尽可能靠近坐标零点;如此一来,即可通过区分判别出zn相对于其它正常样本数据的正常变化特征。

23、为同时求解最大化问题和最小化问题可通过引入系数后,构造如下带约束条件的最大化问题:

24、

25、在公式①中,s.t.是subject to的缩写,表示约束条件;通过在范围内设置系数来调控最大化问题和最小化问题各自的重要性程度,即:当接近于1时,最大化问题的重要性占比接近于100%,而最小化问题的重要性占比接近于0;当接近于0时,最大化问题的重要性占比接近于0,而最小化问题的重要性占比接近于100%;当等于0.5时,最大化问题和最小化问题的重要性占比都等于50%。

26、对公式①中问题的求解可通过拉格朗日乘子法引入乘子系数ηn后,构造相应的拉格朗日函数再设置j相对于θn的偏导数和j相对于ηn的偏导数都等于0,即:

27、

28、其中由此可得:aθn=ηnθn和即上述步骤a-2中的特征值问题;在aθn=ηnθn的等号两边同时左乘即可得到:因此,ηn等价于需要最大化的目标函数,也即求解最大的特征值;公式的目的则是为了得到长度等于1的判别向量,用以表示判别zn和zn方向。

29、作为上述判别分析过程的进一步改进,优选按照如下所示步骤b-1至步骤b-2来设置系数

30、步骤b-1、分别根据公式和计算矩阵a1和矩阵a2。

31、步骤b-2、分别确定所述矩阵a1的最大特征值γ1和所述矩阵a2的最大特征值γ2后,设置所述系数

32、由于矩阵a1和a2的最大特征值γ1和γ2能分别表示a1和a2的谱半径的大小,通过谱半径的比值关系来设置系数能够非常客观的权衡最大化问题和最小化问题的重要性占比,避免了因系数设置不当而导致的判别分析的不适当问题。

33、作为本发明公开的异常监测方法的另一种改进,实施判别分析的过程是:先求解广义特征值问题中最大特征值λn对应的特征向量αn后,再根据计算判别向量wn。

34、广义特征值问题的求解同样是为了实现两个目标,即:通过αn的投影转换满足和然而,不同于使用系数将最大化问题和最小化问题结合起来,此项改进的技术方案是通过比值构造如下所示的最大化问题:

35、

36、求解上述最大化问题可通过约束而将其等价转换为如下带约束条件的最大化问题:

37、

38、针对公式⑤中最大化问题的求解同样可使用拉格朗日乘子法,具体的推理过程与上述针对公式①中问题的求解相同,从而得到一个广义特征值问题

39、由此可见,本发明公开的此种改进技术方案可以在避免设置系数的前提下,同样实现了从和角度的判别分析。

40、作为上述异常监测方法的进一步改进,优选按照如下所示步骤c-1至步骤c-2设置所述步骤2-2中的权重系数ζu和ζe。

41、步骤c-1、根据公式和计算列向量和后,计算中所有元素的均值μn和标准差δu,并计算中所有元素的均值μe和标准差δe;其中,diag{}表示将花括号内的矩阵对角线元素转变成列向量的操作。

42、步骤c-2、设置所述权重系数ζu=μn+3δu,并设置所述权重系数ζe=μe+3δe。

43、由于确定中间矩阵h需要预先设置权重系数ζu和ζe,上述步骤c-1至步骤c-2通过和的平均值和标准差设置权重系数,客观且平等的考量了特征得分和误差生成在异常监测中的权重,对权重系数ζu和ζe的设置提供了一种切实可行的方式。

44、考虑到中间矩阵h在计算异常监测指标中的重要性,同时也作为上述步骤2-2的一种改进,优选使用以下所述步骤2-2a至步骤2-2d来替换所述步骤2-2。

45、步骤2-2a、设置x0=x后,根据公式x=gtx0更新所述x,再执行所述聚类分析阶段的实施过程,从而得到c1,c2,…,ck。

46、步骤2-2b、依次通过公式和分别计算得分矩阵v、载荷矩阵误差生成矩阵和协方差矩阵其中,特征转换矩阵

47、步骤2-2c、根据公式和计算列向量和再计算中元素的均值μn和标准差δu,计算中元素的均值μv和标准差δv,以及计算中元素的均值μe和标准差δe;其中,diag{}表示将花括号内的矩阵对角线元素转变成列向量的操作。

48、步骤2-2d、根据公式x=x0更新所述x后,分别设置权重系数ζu=μn+3δu、权重系数ζv=μv+3δv和权重系数ζe=μe+3δe,再计算中间矩阵

49、通过上述步骤2-2a至步骤2-2d可以发现,在权重系数设置上面,借鉴了步骤c-1至步骤c-2中的改进方案的思想;此外,通过步骤2-2a的更新数据矩阵x后,进一步的调用聚类分析阶段的实施过程,实现了对正常变化特征的更深层次的学习表示,能够发掘出更多更全面的正常变化特征用于识别实时采样数据的异常。

50、作为上述公开的异常监测方法的进一步改进,所述聚类分析阶段的实施过程还包括按照以下所示步骤d-1至步骤d-2初始化k个聚类簇的中心向量c1,c2,…,ck的实施过程。

51、步骤d-1、根据公式f=xxt计算出矩阵f后,再计算f的k个最大的特征值对应的特征向量,依次记为q1,q2,…,qk。

52、步骤d-2、依次设置k=1,2,…,k,并按照公式计算得到ck,从而完成初始化k个聚类簇的中心向量c1,c2,…,ck。

53、由于矩阵f是对称的,矩阵f的特征向量都是相互正交的,这就保证了初始化的k个聚类簇的中心向量c1,c2,…,ck之间不存在信息冗余,提供了一个较好的聚类簇初始点,进而可以有效的避免聚类算法陷入局部最优陷阱中。

54、为了进一步学习表示化工过程对象采样数据在时间先后上的时序相关性,同时也是作为上述公开的异常监测方法的进一步改进,在步骤1与步骤3中实施标准化处理之前还包括对各组采样数据实施增广处理的过程,该增广处理的过程具体是将各组采样数据与其之前连续d个采样时刻获取的d组采样数据合并成一组采样数据;其中,d表示一个不小于2且不大于5的整数。

55、基于上述公开的异常监测方法,本发明还提供一种基于判别特征聚类分析的异常监测装置,包括数据获取模块、数据处理模块、监测显示模块、参数存储模块和参数训练模块,各模块的用途或功能分述如下。

56、数据获取模块用于实时获取所述化工过程在最新采样时刻t的一组采样数据,并将其即时发送给所述数据处理模块;数据处理模块在接收到一组采样数据后,先将其实施标准化处理得到相应的数据向量xt,再依据公式计算最新采样时刻t的异常指标最后将的具体数值发送给所述监测显示模块。

57、监测显示模块在接收到异常指标的具体数值后,以最新采样时刻t为横轴数据,以异常指标的具体数值为纵轴数据进行实时显示,并同时将阈值的具体数值以横线的方式进行显示。

58、参数存储模块中存储有实施标准化处理所需的平均值和标准差、计算异常指标的中间矩阵h和识别异常的阈值参数存储模块将存储的平均值、标准差和中间矩阵h实时提供给所述数据处理模块,并将存储的阈值提供给所述监测显示模块。

59、该异常监测装置的核心关键在于参数训练模块,该模块用于执行实现上述异常监测方法及其改进方案的步骤1至步骤2,并将用于实施标准化处理的平均值和标准差,用于计算异常指标的中间矩阵h,以及用于识别异常的阈值发送至参数存储模块。

60、作为该异常监测装置的进一步改进,优选新增一个历史数据动态存储模块,该历史数据动态存储模块动态存储最近d个连续采样时刻的采样数据,并将其发送给数据处理模块,数据处理模块将从数据获取模块接收到的最新采样时刻t的一组采样数据与从历史数据动态存储模块接收到的d组采样数据合并成一组采样数据后,再计算相应的异常指标参数训练模块执行实现上述涉及增广处理的异常监测方法改进方案的步骤1至步骤2,并将相应的平均值、标准差、中间矩阵h和阈值发送至参数存储模块。从而保证整个异常监测装置是对经增广处理后采样数据实施标准化处理,利用相应的中间矩阵h计算异常指标,并利用相应的阈值识别异常。

61、由此可见,该改进的异常监测装置对应于上述采样数据增广处理的改进方案,可以学习表示化工过程采样数据在时间先后上的时序相关性,从而确保实施更有效的异常监测。


技术特征:

1.一种基于判别特征聚类分析的异常监测方法,包括以下所示步骤1至步骤5:

2.根据权利要求1所述的一种异常监测方法,其特征在于,所述判别特征分析阶段中实施列向量zn与参考矩阵zn之间的判别分析的过程包括以下所示步骤a-1至步骤a-2:

3.根据权利要求2所述的一种异常监测方法,其特征在于,按照以下步骤b-1至步骤b-2设置所述系数

4.根据权利要求1所述的一种异常监测方法,其特征在于,所述判别特征分析阶段中实施列向量zn与参考矩阵zn之间的判别分析的过程是:先求解广义特征值问题中最大特征值λn对应的特征向量αn后,再根据公式计算得到所述wn。

5.根据权利要求1至4中任意一项所述的一种异常监测方法,其特征在于,按照如下所示步骤c-1至步骤c-2设置所述步骤2-2中的权重系数ζu和ζe:

6.根据权利要求1至4中任意一项所述的一种异常监测方法,其特征在于,所述步骤2-2替换为以下所示步骤2-2a至步骤2-2d:

7.根据权利要求1至4中任意一项所述的一种异常监测方法,其特征在于,所述聚类分析阶段的实施过程还包括按照以下所示步骤d-1至步骤d-2初始化k个聚类簇的中心向量c1,c2,…,ck:

8.根据权利要求1至4中任意一项所述的一种异常监测方法,其特征在于,在所述步骤1与步骤3中实施标准化处理之前还包括对各组采样数据实施增广处理的过程,所述增广处理的过程具体是将各组采样数据与其之前连续d个采样时刻获取的d组采样数据合并成一组采样数据;其中,d表示一个不小于2且不大于5的整数。

9.一种基于判别特征聚类分析的异常监测装置,包括数据获取模块、数据处理模块,监测显示模块和参数存储模块;其中,

10.根据权利要求9所述的一种异常监测装置,其特征在于,该异常监测装置还包括历史数据动态存储模块,所述历史数据动态存储模块动态存储最近d个连续采样时刻的采样数据,并将其发送给所述数据处理模块,所述数据处理模块将从数据获取模块接收到的最新采样时刻t的一组采样数据与从历史数据动态存储模块接收到的d组采样数据合并成一组采样数据后,再计算相应的异常指标所述参数训练模块执行实现权利要求8中所述的一种异常监测方法的步骤1至步骤2,并将相应的平均值、标准差、中间矩阵h和阈值发送至参数存储模块。


技术总结
本发明公开一种基于判别特征聚类分析的异常监测方法及装置,能从各个正常数据判别特征的角度对正常运行采样数据的变化特征进行全方位的提取。具体来讲,本发明涉及的异常监测方法通过对各个正常运行工况下的采样数据分别实施判别分析,再结合利用聚类分析对判别向量进行聚类,从而利用代表性的聚类簇的中心向量转换计算得到用于计算异常指标的中间矩阵和识别异常的阈值。本发明针对判别分析,聚类分析和转换计算分别公开了进一步的改进的技术方案,保证了正常变化特征分析的全面性。最后,本发明还依据相同的发明构思设计了一种异常监测装置,该装置保存并实时提供技术参数来实现对实时采样的样本数据进行异常监测,并提供实时的监测图像。

技术研发人员:童楚东,王萌
受保护的技术使用者:宁波职业技术学院
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-27981.html

最新回复(0)