本发明涉及一种基于分布特征子集的真空干泵故障预测方法。
背景技术:
1、随着电子技术的飞速发展,半导体产业作为现代电子行业的核心,对高精度、高效能的生产工艺提出了更高的要求。真空技术及其核心组成部分在半导体制造中处于关键地位,真空干泵是制造真空环境的设备,扮演着至关重要的角色,因此越来越多的研究者投入到真空干泵故障预测的研究领域中,他们致力于构建精确的干泵故障预测模型,利用这些模型和工具预测干泵故障,以此保障半导体生产的安全进行。
2、故障设备的运行数据对于构建准确的干泵故障预测模型非常重要,因此研究者需要充分挖掘宕机数据中的异常信息,针对预测时刻的运行数据尽可能更加合理地从宕机数据中选择更多的样本。
3、为了进一步优化宕机历史数据库的样本选择,提供一种基于分布特征子集的真空干泵故障预测方法。
技术实现思路
1、本发明的目的在于克服现有的缺陷而提供的一种基于分布特征子集的真空干泵故障预测方法,实现了更好的真空干泵故障预测效果。
2、实现上述目的的技术方案是:
3、一种基于分布特征子集的真空干泵故障预测方法,包括:
4、步骤s1,构建真空干泵运行状态向量集dpvs;
5、步骤s2,根据真空干泵运行状态向量集dpvs构建基于特征子集的数据分布向量集dpfi;
6、步骤s3,根据真空干泵运行状态向量集dpvs和基于特征子集的数据分布向量集dpfi构建真空干泵分布特征子集dpfs;
7、步骤s4,根据真空干泵分布特征子集dpfs计算真空干泵分布特征子集之间距离,得到待预测真空干泵分布特征子集距离列表fs_dist;
8、步骤s5,根据基于特征子集的数据分布向量集dpfi和待预测真空干泵分布特征子集距离列表fs_dist构建基于分布特征子集的干泵故障预测训练集fddpd;
9、步骤s6,使用logistic分类器对基于分布特征子集的干泵故障预测训练集fddpd建立真空干泵故障预测模型bfpm,通过真空干泵故障预测模型bfpm对其他宕机泵数据进行真空干泵故障预测。
10、优选的,所述步骤s1包括:
11、步骤s11,基于真空干泵在市场实际应用获取相同类型真空干泵运行数据集合;
12、步骤s12,以同一种真空干泵类型下不同编号构建真空干泵运行数据子集;
13、步骤s13,基于干泵电机功率、电机转速、传感器温度、氮气流量和排气压力参数,构建真空干泵运行状态秒级向量{time, drypumppower, boosterpower,dpinverterspeed, mbinverterspeed, dptemperature, mbtemperature, n2 flow,exhaustpressure };
14、步骤s14,将已经宕机真空干泵中的运行状态数据集合通过所述步骤s13处理得到宕机运行状态向量集edpvs =[rsv1, rsv2, …, rsvi],其中i=1,2,3,…,n;
15、步骤s15,将待测真空干泵中的所有时刻对应的运行状态数据集合通过所述步骤s13处理得到待测真空干泵运行状态向量集tdpvs=[rsv1, rsv2, …, rsvj],其中j=1,2,3,…,m;
16、步骤s16,通过干泵宕机运行的历史数据构建宕机运行状态标签集el=[el1, el2,…, elx],其中x=1,2,3,…,n;该标签集与所述步骤s14中宕机运行状态向量集ersvs中每一台真空干泵对应;
17、步骤s17,通过得到的宕机运行状态向量集edpvs、待测真空干泵运行状态向量集tdpvs和宕机运行状态标签集el,构建真空干泵运行状态向量集dpvs={edpvs, el,tdpvs}。
18、优选的,所述步骤s13中,time代表设备运行的此刻时间,drypumppower代表下面干泵的工作功率,boosterpower代表上面干泵的工作功率,dpinverterspeed代表下面干泵的工作频率,mbinverterspeed代表上面干泵的工作频率,dptemperature代表下面干泵的工作温度,mbtemperature代表上面干泵的工作温度,n2 flow代表干泵中通入的氮气流量,exhaustpressure代表干泵的尾气排出压力。
19、优选的,所述步骤s2包括:
20、步骤s21,设置数据分布向量处理基本单位为小时;
21、步骤s22,读取单台真空干泵的运行状态数据trsd;
22、步骤s23,将读取的运行状态数据trsd通过数据分布向量处理,得到单台干泵的单位向量集trsdb,将单位向量集trsdb中第一行数据对应的时间作为该trsdb的时间,记为trsdb_t;
23、步骤s24,读取一个运行状态特征sf,计算运行状态特征sf的最小值、最大值、平均值、标准差和中位数,将这五个数值作为该特征的数据分布向量,记为sfdv;
24、步骤s25,对单台干泵的单位向量集trsdb中的每个运行状态特征sf进行遍历,并通过所述步骤s24中的处理,得到真空干泵运行数据分布向量,其形式为[sfdv1, sfdv2,…, sfdvk],其中k=1,2,3,…,8;
25、步骤s26,对所述步骤s17中的真空干泵运行状态向量集dpvs中的宕机运行状态向量集edpvs通过所述步骤s21-步骤s25处理,得到宕机运行状态数据分布向量集dpfi-e;
26、步骤s27,对所述步骤s17中的真空干泵运行状态向量集dpvs中的待测真空干泵运行状态向量集tdpvs通过所述步骤s21-步骤s25处理,得到待预测真空干泵运行状态数据分布向量集dpfi-t;
27、步骤s28,对宕机运行状态数据分布向量集dpfi-e中的每个处理单位的第一行数据对应的时刻标记为该单位分布向量的时刻,得到宕机运行状态标签集el;
28、步骤s29,通过得到的宕机运行状态数据分布向量集dpfi-e、待预测真空干泵运行状态数据分布向量集dpfi-t和宕机运行状态标签集el,构建干泵运行数据分布向量集dpfi={dpfi-e, el, dpfi-t}。
29、优选的,所述步骤s3包括:
30、步骤s31,获取构建的真空干泵运行状态秒级向量,并选择真空干泵运行状态秒级向量中的一个子集svs;
31、步骤s32,按真空干泵运行状态秒级向量子集svs从宕机运行状态数据分布向量集dpfi-e中选择原始特征对应的数据分布向量,得到宕机历史数据分布特征子集dpfs-s;
32、步骤s33,按真空干泵运行状态秒级向量子集svs从待预测真空干泵运行状态数据分布向量集dpfi-t中选择原始特征对应的数据分布向量,得到待预测真空干泵分布特征子集dpfs-t;
33、步骤s34,获取宕机运行状态标签集el,进而根据宕机历史数据分布特征子集dpfs-s、待预测真空干泵分布特征子集dpfs-t和宕机运行状态标签集el,构建干泵分布特征子集dpfs={dpfs-s, el, dpfs-t}。
34、优选的,所述步骤s4包括:
35、步骤s41,获取宕机历史数据分布特征子集dpfs-s和待预测真空干泵分布特征子集dpfs-s;
36、步骤s42,选择待预测真空干泵分布特征子集dpfs-t中某个设备的一个时刻对应的特征子集向量;
37、步骤s43,按顺序依次计算与宕机历史数据分布特征子集dpfs-s中每一个时刻的特征子集向量的欧氏距离,得到一个待预测真空干泵分布特征子集距离列表fs_dist =[dist1, …, diste],其中e=1,2,3,…,m。
38、优选的,所述步骤s5包括:
39、步骤s51,对得到的一个待预测真空干泵分布特征子集距离列表fs_dist,从小到大排序,并记录排序后的索引index_fs;
40、步骤s52,选择排序后的索引index_fs中前k个索引,构建前k个最相似索引集ms_k;
41、步骤s53,遍历待预测真空干泵特征子集dpfs-t中所有子集按照所述步骤s51-步骤s52执行得到该分布特征子集的最相似索引集ms_kv;
42、步骤s54,将得到的最相似索引集ms_kv组合得到最相似重复索引集repeated-indexv;
43、步骤s55,将最相似重复索引集repeated-indexv去除重复的索引得到该时刻在第d个宕机设备中所需训练集索引train-indexd;
44、步骤s56,将宕机运行状态数据分布向量集dpfi-e按照所述步骤s55的训练集实例索引train-indexi取出,得到基于分布特征子集的特征集fddpd-data;
45、步骤s57,将宕机运行状态标签集el按照所述步骤s55的训练集实例索引train-indexi取出,得到基于分布特征子集的标签集fddpd-label;
46、步骤s58,根据基于分布特征子集的特征集fddpd-data和基于分布特征子集的标签集fddpd-label构建基于分布特征子集的真空干泵故障预测训练集fddpd={fddpd-data,fddpd-label}。
47、本发明的有益效果是:本发明基于分布特征子集的真空干泵故障预测方法,在宕机历史数据库的样本选择过程中,通过动态调整特征子集个数和计算特征子集之间欧氏距离选择不同样本,将不同特征子集下获取的样本合并组成最终的训练样本集,该方法有助于实现更好的真空干泵故障预测效果。
1.一种基于分布特征子集的真空干泵故障预测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于分布特征子集的真空干泵故障预测方法,其特征在于,所述步骤s1包括:
3.根据权利要求2所述的一种基于分布特征子集的真空干泵故障预测方法,其特征在于,所述步骤s13中,time代表设备运行的此刻时间,drypumppower代表下面干泵的工作功率,boosterpower代表上面干泵的工作功率,dpinverterspeed代表下面干泵的工作频率,mbinverterspeed代表上面干泵的工作频率,dptemperature代表下面干泵的工作温度,mbtemperature代表上面干泵的工作温度,n2 flow代表干泵中通入的氮气流量,exhaustpressure代表干泵的尾气排出压力。
4.根据权利要求2所述的一种基于分布特征子集的真空干泵故障预测方法,其特征在于,所述步骤s2包括:
5.根据权利要求4所述的一种基于分布特征子集的真空干泵故障预测方法,其特征在于,所述步骤s3包括:
6.根据权利要求5所述的一种基于分布特征子集的真空干泵故障预测方法,其特征在于,所述步骤s4包括:
7.根据权利要求6所述的一种基于分布特征子集的真空干泵故障预测方法,其特征在于,所述步骤s5包括:
