本发明属于机械故障诊断,尤其涉及一种基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断方法及系统。
背景技术:
1、旋转机械广泛应用于航空航天、数控加工、医疗器械、风力发电等领域,齿轮箱和轴承等旋转部件作为旋转机械重要组件,直接影响旋转机械的健康状态。因此,及时、准确地诊断旋转机械的健康状态在设备运维方面显得非常重要。传统机器学习方法需要手动提取特征,对领域知识和专家经验要求较高,不适用于当前智能故障诊断的需求。因而,以深度自编码器、卷积神经网络、长短期记忆网络为代表的深度学习方法在机械故障领域得到广泛应用。然而这些方法仅适用于同一工况下,即训练数据和测试数据服从相同的概率分布,并且需要大量有标签的数据来训练模型。在实际工业生产中,存在大量变工况场景,由于不同工况下的数据服从不同概率分布,且缺乏足够的有标签数据,传统深度学习方法不仅诊断精度低,而且泛化性能弱,无法用于实际工业场景中变工况下的故障诊断。
2、针对变工况场景,学者们提出基于迁移学习的故障诊断方法,用以解决变工况样本数据不足或无标签数据下的故障诊断问题。cn202310623051.9公开了一种跨域风电齿轮箱故障诊断方法,该方法首先对获取的风电齿轮箱源域和目标域的状态数据依次进行特征提取、权重生成以及特征分类,并对结果进行特征鉴别,以得到风电齿轮箱域内故障诊断的数据;然后进行统一故障诊断,对得到的风电齿轮箱域内故障诊断数据进行健康状态分类、域分类以及对比学习处理,以得到风电齿轮箱统一故障诊断结果。该方法虽然使用对比学习和迁移学习方法实现了变工况风电齿轮箱故障诊断。但是,该方法存在不足之处是,仅使用迁移学习方法减小了源域和目标域的边缘分布差异,没有考虑源域和目标域之间的条件分布差异,导致在域分布差异较大时模型精度下降,无法准确地识别出风电齿轮箱故障类型。
3、通过上述分析,现有技术存在的问题及缺陷为:
4、现有机械故障诊断仅使用迁移学习方法减小了源域和目标域的边缘分布差异,没有考虑源域和目标域之间的条件分布差异,导致在域分布差异较大时模型精度下降。
技术实现思路
1、针对现有技术存在的问题,本发明提供了一种旋转机械变工况自监督域适应故障诊断方法及系统。
2、本发明是这样实现的,一种旋转机械变工况自监督域适应故障诊断方法包括:
3、步骤1,采集旋转机械在不同工况下的振动加速度信号,从振动加速度信号中截取数据段构造样本,获得有标记的源域数据集和无标记的目标域数据集;
4、步骤2,源域和目标域数据增强,构建正负样本对;
5、步骤3,构建基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断模型,包括:时域/频域特征编码器gq和gk、时域/频域投影头和时频一致性投影头rt和rf,分类器cf,其中,gk为动量编码器,不参与梯度回传;
6、步骤4,输入有标签的源域数据和无标签的目标域数据及其增强之后的数据,进行动量对比学习,提取时域和频域特征,并在时频一致性对比学习模块进行特征融合;
7、步骤5,实例级别的动态分布自适应,对融合之后的源域特征和目标域特征进行动态分布自适应,并通过分类器cf预测设备健康状态;
8、步骤6,根据步骤4和步骤5计算各部分损失,反向传播更新模型参数;
9、步骤7,模型测试;使用已经训练好的特征提取器和分类器构建测试模型,将目标域测试样本输入特征提取器,由分类器输出诊断结果,得到目标域样本的健康状态识别结果。
10、进一步,所述源域数据和目标域数据定义如下:
11、所述源域数据集和目标域数据集分别定义为:和其中和分别为源域数据集中的时域样本和频域样本,为源域数据集的时域中第i个样本,为源域中第i个样本对应的故障类别;ns和nt分别为源域和目标域样本的数量;
12、目标域中时域和频域样本为:
13、进一步,所述数据增强方式如下:
14、(1)时域数据增强
15、抖动:通过模拟附加传感器噪声进行数据增强,提高模型对对噪声的鲁棒性和精度;数学公式如下:
16、x′=x1+ε1,…,xt+εt,…,xt+εt
17、其中,ε为加在每个时间步上的高斯噪声,ε:n(0,σ2);附加噪声的标准差σ是一个需要预先确定的超参数,本发明设置为0.1;
18、缩放:根据目标任务,通过随机标量来修改时间序列的幅值;对于缩放参数α,缩放是将α乘以整个时间序列,其计算公式如下:
19、x′=α·x α~n(2,2)
20、置换:用于随机扰动事件在时间上的位置,即窗口内的时间位置被随机重新排列;首先将数据分割成e个相同长度的段,e的范围从1到5,然后随机排列这些段以创建一个新窗口;
21、(2)频域数据增强
22、具体操作如下:
23、1)去除频率分量;随机选择m个频率分量将其振幅设置为0;
24、2)添加频率分量;在增加频率分量时,从振幅小于αam的频率分量中随机选取m个频率分量,将其振幅增大到αam;其中,am为频谱中的最大幅值,α为调节扰动频率分量尺度的预定义系数,本实施例设置为0.5。
25、进一步,所述步骤3构建的时域/频域特征编码器gq和gk、时域/频域投影头和用于时域和频域的动量对比学习提取时域和频域特征,时频一致性投影头rt和rf用于时频一致性对比学习,并对时域特征和频域特征进行特征融合,分类器cf用于设备健康状态识别。
26、进一步,所述步骤4中动量对比学习提取时域和频域特征,时频一致性对比学习进行特征融合,并减小相同故障类别之间的差异,其中动量对比损失和时频一致性对比损失计算方法如下:
27、(1)动量对比损失
28、1)时域对比损失
29、对于给定的输入时间序列样本xi,通过基于时间的增强库生成一个增强集每个元素是基于时间特征由xi增强而来;
30、对于源域输入样本随机选择增强样本输入到编码器gq和gk得到同理可得目标域编码器之后的特征为:随后将得到特征和输入到投影头pq和pk中映射到特征空间中,得到同理得到目标域投影之后的特征为:基于时域对比损失函数以样本和为单位定义时域对比损失和频域对比损失为:
31、
32、其中,为源域中的时域对比损失,为目标域中的时域对比损失,τ为温度超参数,设置为0.07,k为负样本数量,sim(a,b)为余弦相似度函数,计算方法如下式所示:
33、
34、2)频域对比损失
35、通过快速傅里叶变换将源域和目标域中的时域样本和生成频域样本:和同理,对于给定的输入频域样本xfi,通过基于时间的增强库生成一个增强集每个元素是基于频域样本xfi增强;
36、参考时域对比学习,对于源域和目标域输入频域样本和输入到对比学习网络框架中可以得到经过投影头之后的用于对比损失的特征:因此,基于频域对比损失函数以样本和为单位定义时域对比损失和频域对比损失为:
37、
38、3)动量对比学习总损失
39、动量对比学习总损失为源域和目标域时域对比损失和频域对比损失之和,具体计算如下:
40、
41、其中lcl为动量对比学习总损失,为源域的动量对比学习损失,同理为目标域动量对比学习损失;
42、(2)时频一致性对比损失
43、对于源域的每个输入样本xi,有四个特征:和前两个是基于时域特征生成的,后两个基于频域特征生成的;对于目标域输入同样有四个特征:和
44、使用来表示和之间的距离,即基于时域表示和基于频域表示之间的距离;的数学公式如下:
45、
46、式中,ι[k≠i]∈{0,1}为指示函数,k≠i时取值为1,n为一个小批量样本的总数;
47、类似的,定义和同理,目标域样本嵌入到时频空间中也有四个距离:和
48、基于对比学习思想,在嵌入空间中与相比,应该更接近基于此思想,在时频一致性模块,所提出的方法学习到的应该小于根据三元组损失,设计作为源域一致性损失项,其中δ是给定的裕度以保持远离负样本;同样,应该小于
49、源域样本和目标域样本的一致性损失为:
50、
51、式中,裕度δ设置为1,ds-pair表示基于时域的嵌入特征和基于频域的嵌入特征之间的距离;
52、时频一致性总损失lcon为源域一致性损失加上目标域一致性损失,具体计算如下所示:
53、
54、进一步,所述步骤5中的实例级别动态分布自适应损失计算方法如下:
55、将时频一致性模块经过投影头rt和rf之后的时域和频域拼接之后输入到fc1中,从而得到源域特征和目标域特征如下所示:
56、
57、式中,表示将时域和频域特征进行拼接;
58、(1)实例级别的动态分布自适应
59、1)边缘分布自适应
60、采用最大均值差异(maximum mean discrepancy,mmd)来衡量源域和目标域之间的边缘分布之间的差异,mmd计算公式为:
61、
62、式中,ns和nt分别表示源域和目标域的样本数,φ(·)表示将提取的特征映射到再生希尔伯特空间的非线性映射函数;
63、2)实例级别的动态分布自适应
64、平衡因子μ;不同域的第c个故障类别之间的条件分布差异计算公式如下:
65、
66、式中,为源域样本对于第c个故障类别的真实标签和为目标域样本的伪标签,目标域样本经过分类器cf得到目标域样本的预测概率;
67、综上,实例级别的动态分布自适应损失计算公式如下所示:
68、
69、式中,μ∈[0,1)为第c类别边缘分布损失的动态平衡因子,采用a-distance作为基本度量方式,则μ(c)具体计算方式如下:
70、
71、(2)健康状态识别
72、分类器cf用于识别设备的健康状态;最小化源域故障诊断分类误差来训练分类器cf,对于c个健康类别的源域数据;采用交叉熵损失来构建源域分类误差,计算方式如下:
73、
74、式中,lce为交叉熵损失函数,为源域样本的真实标签;
75、步骤6中模型训练,更新网络参数方式如下:
76、结合动量对比损失、时频一致性对比损失、实例级别的动态分布自适应损失、和源域分类损失,最终的优化目标可以定义为:
77、l=αlc+βlcl+γlcon+λlidmmd
78、式中,α,β,γ为超参数,λ为惩罚参数,表示迁移强度,λ>0;
79、使用adam优化算法对本发明方法进行训练,设θg,θp,θr和θc分别为时域编码器gq、投影头pt、投影头rt、投影头rf和分类器cf的参数;将优化目标重新写为:
80、l(θg,θp,θr,θc)=minαlc(θg,θr,θc)+βlcl(θg,θp)+
81、γlcon(θg,θr)+λlidmmd(θg,θr,θc)
82、再利用adam优化器在每个训练迭代更新网络参数如下式所示:
83、
84、其中,η表示学习率,和分别代表θg、θr、θp和θc优化后的参数;通过反向传播,更新模型参数。
85、本发明的另一目的在于提供一种基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断系统包括:
86、信号采集模块,用于采集旋转机械在不同工况下的振动加速度信号,从振动加速度信号中截取数据段构造样本,获得有标记的源域数据集和无标记的目标域数据集;
87、构建正负样本对模块,用于源域和目标域数据增强,构建正负样本对;
88、故障诊断模型构建模块,用于构建基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断模型,包括:时域/频域特征编码器gq和gk、时域/频域投影头和时频一致性投影头rt和rf,分类器cf,其中,gk为动量编码器,不参与梯度回传;
89、特征提取模块,用于输入有标签的源域数据和无标签的目标域数据及其增强之后的数据,进行动量对比学习,提取时域和频域特征,并在时频一致性对比学习模块进行特征融合;
90、自适应模块,用于实例级别的动态分布自适应,对融合之后的源域特征和目标域特征进行动态分布自适应,并通过分类器cf预测设备健康状态;
91、参数更新模块,用于根据步骤4和步骤5计算各部分损失,反向传播更新模型参数;
92、模型测试模块,用于模型测试;使用已经训练好的特征提取器和分类器构建测试模型,将目标域测试样本输入特征提取器,由分类器输出诊断结果,得到目标域样本的健康状态识别结果。
93、本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断方法的步骤。
94、本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断方法的步骤。
95、本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断系统。
96、结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:
97、第一、针对上述现有技术存在的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
98、(1)本发明采用时域信号和频域信号进行互补,来解决由于工况复杂、环境恶劣等因素会导致基于时域的表示或者基于频域的表示会存在特征偏移,导致模型可迁移性较差,出现负迁移的问题。
99、(2)本发明将自监督对比学习和迁移学习相结合,采用自监督对比学习来减小相同故障类别之间的距离,最大化不同故障类别之间的距离,以提高模型的诊断精度,采用实例级别的动态分布自适应迁移学习策略自适应的调整边缘分布差异和条件分布差异的权重,实现动态分布自适应,从而提高模型在新工况下的诊断能力和泛化性能。
100、(3)本发明构建了时频一致性对比学习模块,有效地减小了基于时域的表示和基于频域的表示之间的差异,并进行特征融合,实现了对源域和目标域的域不变特征提取。
101、第二,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
102、(1)本发明的技术方案转化后的预期收益和商业价值为:
103、由于旋转机械结构复杂以及运行工况多变,长时间运行过程中,其核心部件如齿轮、轴承等难免会发生退化失效,轻则导致机械加工偏离指定指标,重则导致设备损坏,造成重大经济损失,而采用本发明技术方案可以实现变工况旋转机械故障诊断,提前预测旋转机械健康状态,防止设备损坏造成人员伤亡,避免停机维修,降低生产效率,同时有助于设备健康管理,延长设备使用寿命。因此,采用本发明技术方案,对保障设备稳定可靠地运行,减少停机时间,提高经济效益,具有重要的工程应用价值。
104、(2)本发明的技术方案是否解决了人们一直渴望解决、但始终未能获得成功的技术难题:
105、本发明将自监督对比学习和迁移学习相结合,采用自监督对比学习来减小相同故障类别之间的距离,最大化不同故障类别之间的距离,同时采用实例级别的动态分布自适策略自适应的调整边缘分布差异和条件分布差异的权重,实现类级别特征对齐,解决了现有的故障诊断方法在分类边界存在误分类问题,以及工况差异大导致模型诊断精度下降的问题。同时采用时域信号和频域信号进行互补,解决了由于工况复杂、环境恶劣等因素会导致基于时域的表示或者基于频域的表示会存在特征偏移,导致模型可迁移性较差,出现负迁移的问题。
1.一种旋转机械变工况自监督域适应故障诊断方法,其特征在于,所述旋转机械变工况自监督域适应故障诊断方法包括以下步骤:
2.如权利要求1所述旋转机械变工况自监督域适应故障诊断方法,其特征在于,所述源域数据和目标域数据定义如下:
3.如权利要求1所述旋转机械变工况自监督域适应故障诊断方法,其特征在于,所述数据增强方式如下:
4.如权利要求1所述旋转机械变工况自监督域适应故障诊断方法,其特征在于,所述步骤3构建的时域/频域特征编码器gq和gk、时域/频域投影头和用于时域和频域的动量对比学习提取时域和频域特征,时频一致性投影头rt和rf用于时频一致性对比学习,并对时域特征和频域特征进行特征融合,分类器cf用于设备健康状态识别。
5.如权利要求1所述旋转机械变工况自监督域适应故障诊断方法,其特征在于,所述步骤4中动量对比学习提取时域和频域特征,时频一致性对比学习进行特征融合,并减小相同故障类别之间的差异,其中动量对比损失和时频一致性对比损失计算方法如下:
6.如权利要求1所述旋转机械变工况自监督域适应故障诊断方法,其特征在于,所述步骤5中的实例级别动态分布自适应损失计算方法如下:
7.一种实施如权利要求1-6任意一项所述旋转机械变工况自监督域适应故障诊断方法的基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断系统,其特征在于,所述基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断系统包括:
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述旋转机械变工况自监督域适应故障诊断方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述旋转机械变工况自监督域适应故障诊断方法的步骤。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述基于自监督对比动态分布自适应网络的变工况旋转机械故障诊断系统。
