本发明属于故障诊断,具体涉及基于timevae-lightgbm的时间序列数据故障诊断方法。
背景技术:
1、高铁等高速交通工具的安全性和可靠性对于现代交通系统至关重要。在高铁运行过程中,各种零件的故障可能导致事故、运行延误和维修成本的增加。因此,发展高效准确的故障诊断方法对于保障高铁的稳定运行具有重要意义。
2、近年来,深度自动编码器(dae)、深度卷积神经网络(dcnn)等深度神经网络已经被广泛应用于智能诊断模型,减少了对人工经验和专家知识的依赖,极大地促进了智能故障诊断技术的发展。在机械系统的长退化过程中,实际工程应用很少发生故障,加上相关信息记录不完善,导致故障样本的数量十分匮乏。因此,故障状态和正常状态的样本比例不平衡,因此在故障诊断领域,往往会遇到样本数量不足和数据不平衡的问题。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过于关注多数类,从而使得少数类样本的分类性能下降。在面对样本比例不平衡和样本数量不足的问题时,采用机器学习算法对此类小样本数据集进行分类过程时会出现训练模型会偏向于多数类、对少数类样本的诊断性能不高、以及对少量样本的故障类别出现较高的误诊率的问题。
技术实现思路
1、本发明的目的是提供timevae-lightgbm的时间序列数据故障诊断方法,解决的现有技术中存在的由于样本少、数据不平衡导致的误诊率较高的问题。
2、本发明所采用的技术方案是,基于timevae-lightgbm的时间序列数据故障诊断方法。
3、具体按以下步骤实施:
4、步骤1、数据预处理,得到原始故障数据集x;
5、步骤2、构建timevae网络模型,包括编码器网络和解码器网络;
6、步骤3、timevae模型训练;
7、步骤4、将与x进行合并,形成平衡数据集,并划分训练集和测试集;
8、步骤5、构建lightgbm模型,并将训练集输入到lightgbm模型进行迭代训练,得到分类模型;
9、步骤6、将分类模型作为故障诊断模型,实时输入故障数据进行故障诊断。
10、本发明的特点还在于,
11、步骤1具体为:对原始故障数据进行基于统计方法的特征提取,即提取统计特征作为特征矢量数据,并对特征矢量数据加入时间步维度,得到原始故障数据集x;
12、统计特征包括均值、标准差、方差、最小值、最大值、峰值、偏度以及峰度,特征矢量数据是一个二维的数组(n*d),在原有维度(n*d)上加入时间步维度,变成三维度(n*t*d)的原始故障数据集x,其中,n代表数据量,d代表特征数,t代表时间步。
13、步骤2具体如下:
14、步骤2.1、构建编码器网络;
15、编码器网络包括三层卷积层,一层flatten层和一个全连接层;
16、卷积层的参数如下:第一个卷积层使用50个卷积核,卷积核大小为3,滑动窗口为2,激活函数为relu;第二个卷积层使用100个卷积核,卷积核大小为3,滑动窗口为2,激活函数为relu;第三个卷积层使用200个卷积核,卷积核大小为3,滑动窗口为2,激活函数为relu;
17、flatten层将卷积层生成的多维特征映射转换为一维向量,再经dense将特征映射转换为潜在变量的均值和方差;
18、步骤2.2、构建解码器网络;
19、解码器网络包括base模块、时间趋势性模块和季节性模块三种模块,在训练的过程中根据参数选择模块;
20、base模块由八层网络构成,依次包括全连接层、重塑层、第一个逆向卷积层、第二个逆向卷积层、第三个逆向卷积层、最终逆向卷积层、flatten层、全连接层和重塑层;
21、逆向卷积层参数为:第一个逆向卷积层使用50个卷积核,卷积核大小为3,滑动窗口为2,激活函数为relu;第二个逆向卷积层使用100个卷积核,卷积核大小为3,滑动窗口为2,激活函数为relu;第三个逆向卷积层使用200个卷积核,卷积核大小为3,滑动窗口为2,激活函数为relu;
22、base模块网络中,全连接层将输入的潜在变量映射到更高维度的特征表示;重塑层将全连接层的输出重新构造为三维形状的特征映射;再经过三个逆向卷积层进行逆向卷积操作,过最终逆向卷积层将特征映射恢复为原始数据的维度;再经过flatten层将特征映射转换为一维向量;全连接层将一维向量映射回原始数据的形状;最后经过一个重塑层:将全连接层的输出重新构造为三维形状,得到解码器的输出,即重构的数据样本;
23、时间趋势性模块网络结构包括全连接层1、全连接层2、重塑层、生成多项式空间、矩阵相乘、转置操作构成;
24、时间趋势性模块网络中,全连接层1将潜在变量z映射转换为多维向量,并用relu作为激活函数,输出经过到全连接层2,输出维度不变;重塑层将全连接层的输出重新构造为趋势参数θtr的维度;生成多项式空间用于构建趋势模型;使用矩阵相乘操作,将趋势参数θtr与多项式空间相乘,得到趋势的值;由于矩阵相乘后的结果是(n*d*t)形状,进行转置操作,将维度转换成(n*t*d);
25、季节性模块网络结构包含五层网络:两个全连接层、重塑层、季节指数层和季节数组索引层;
26、季节性模块网络中,对于每个季节性模式g,timevae首先利用潜在向量z估计维度为n*d*m的季节参数矩阵,设s是每个季节性模式的索引,m为季节的数量;然后将数据集x的每个时间步对应于特定的季节参数元素进行索引,检索形状为n*t*d的季节模式值最终的季节性估计值vsn是g=1,2,…,s上所有的元素求和。
27、步骤2.3、定义损失函数;
28、步骤2.3具体为:计算估计分布与真实分布pθ(z|x)的kl散度损失:
29、
30、得到vae的损失函数:
31、
32、其中,pθ(z)是潜在变量z的先验分布,等号右边的第一项是从估计分布种采样的潜在变量z的对数似然的负数,定义为重建误差,第二项是估计分布与pθ(z)之间的kl散度损失,timevae对重建误差使用权重因子ɑ,增加或减少对重构损失的重视,则:
33、
34、权重因子ɑ的取值范围为[0.5,3.5],ɑ值通过生成样本的效果动态调整。
35、步骤3具体如下:
36、步骤3.1、将步骤1经过预处理后的数据集x输入编码器网络,计算出估计分布的均值和方差:
37、
38、其中,μi和σ2(i)分别是多元高斯分布第i个向量的均值和方差。
39、均值计算:编码器网络最后的全连接层有两个输出,第一个输出生成均值μ,表示为:
40、μ=dense(x);
41、方差计算:编码器网络最后的全连接层第二个输出生成方差σ,表示为:
42、σ=dense(x);
43、步骤3.2、将通过重采样方法从编码器生成的估计分布中采样,得到潜在变量z,使用重参数技巧,从标准正态分布中采样,然后和编码器输出的均值和方差做运算:
44、
45、其中,代表了从估计分布中进行采样的过程,ε(l)是标准正态分布l代表对ε的第l次采样,l代表采样的次数;
46、步骤3.3、将重采样得到的潜在变量z输入解码器网络,通过反向转播更新网络的参数,最小化损失函数训练完成后,得到生成模型pθ(x|z)pθ(z),其中pθ(x|z)是decoder网络,从先验分布pθ(z)中随机采样一个潜在变量z,送入decoder网络,得到生成故障数据集
47、
48、步骤4具体为:将步骤3得到的生成故障数据集与原始故障数据集x以1:1的比例进行合并,形成平衡数据集,并以7:3的比例划分训练集和测试集。
49、步骤5具体如下:
50、定义lightgbm目标函数如下:
51、
52、其中,l和r分别代表损失函数和正则化项,f(t)表示第n次迭代训练出得到的决策树。当前模型在第n次迭代时对样本xi的预测结果可以定义为:
53、
54、其中f(t)(xi)表示决策树f(t)对样本xi的预测值。因此,目标函数可以改写为:
55、
56、步骤5中训练过程具体如下:
57、步骤5.1、模型通常用一个简单的初始模型,例如常数值来拟合数据;
58、步骤5.2、每一轮迭代,模型根据当前参数计算损失函数的梯度,然后使用梯度下降法来更新模型参数,以最小化目标函数。
59、步骤5.3、通过反复迭代上述过程,模型会逐渐收敛到一个局部最优解,从而得到一个在训练数据上表现良好且具有一定泛化能力的模型。
60、步骤6具体为:使用步骤5中训练好的lightgbm模型在测试集上做分类测试,通过使用混淆矩阵热力图、准确率、精准率、召回率、f1-score对分类模型进行评价。
61、本发明的有益效果是,本发明的基于timevae-lightgbm的故障诊断方法,使用timevae进行数据增强,在学习有效特征的同时,保证生成样本的数量和质量,增加原始样本的数量,随后采用lightgbm集成学习算法进行分类,两种模型的结合有效提高了对时间序列故障样本进行分类的准确性,为故障诊断提供可靠保障。
1.基于timevae-lightgbm的时间序列数据的故障诊断方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤1具体为:
3.根据权利要求2所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤2具体如下:
4.根据权利要求3所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤2.1中,编码器计算如下:
5.根据权利要求4所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,步骤2.2中,所述base模块由八层网络构成,依次包括全连接层、重塑层、第一个逆向卷积层、第二个逆向卷积层、第三个逆向卷积层、最终逆向卷积层、flatten层、全连接层和重塑层;
6.根据权利要求4所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤2.3具体为:计算估计分布与真实分布pθ(z|x)的kl散度损失:
7.根据权利要求6所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤3具体如下:
8.根据权利要求7所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤4具体为:
9.根据权利要求8所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤5具体为,将步骤4中的训练集输入到lightgbm算法模型中进行迭代训练,训得到分类模型,具体如下:
10.根据权利要求9所述的基于timevae-lightgbm的时间序列数据故障诊断方法,其特征在于,所述步骤5训练过程具体如下:
