本发明涉及计算机,特别是涉及一种预警工单生成方法、装置、设备及介质。
背景技术:
1、在当今快速发展的信息技术时代,云中心作为数据和应用程序的主要处理和存储地,其稳定性和效率对于企业和个人用户至关重要。传统上,云中心的运维团队依靠手动监控和处理工单来维护系统的正常运行。然而,随着云中心规模的扩大和复杂性的增加,这种传统方法面临着多方面的挑战。
2、手动监控和分析大量的系统数据耗时且易出错。云中心产生的数据量巨大,包括各种性能指标、系统日志、用户反馈等。人工分析这些数据以识别潜在的系统问题是一个繁重且低效的过程。此外,人工处理的结果往往受限于个人经验和主观判断,这可能导致对系统问题的诊断不准确或延迟。
3、因此,如何解决传统云中心管理中工单处理的效率和准确性问题,是本领域亟待解决的技术问题。
技术实现思路
1、本发明的目的是提供一种预警工单生成方法、装置、设备及介质,可以大幅减少人工干预的主观性和时间消耗,提高预警工单生成的准确性和效率。
2、为了解决上述技术问题,本发明提供一种预警工单生成方法,所述方法包括:
3、获取云中心平台下不同区域的历史运行数据和对应的健康情况;
4、对所述历史运行数据进行预处理,得到平台健康度指标数据;
5、利用所述平台健康度指标数据和所述云中心平台的健康情况对平台健康度模型进行训练;
6、将多个待测云中心平台下各区域的健康度指标数据输入至训练好的平台健康度模型,预测各所述待测云中心平台下各区域存在的故障风险概率;
7、根据各所述待测云中心平台下各区域存在的故障风险概率,自动生成预警工单。
8、第一方面,在本发明提供的上述预警工单生成方法中,对所述历史运行数据进行预处理,得到平台健康度指标数据,包括:
9、对所述历史运行数据进行清洗;
10、对清洗后的运行数据中的缺失值进行填充;
11、将填充后的运行数据进行数值化,标准化或归一化,以使填充后的运行数据转换为所述平台健康度模型输入数据的目标格式;
12、根据格式转换后的运行数据,得到平台健康度指标数据。
13、另一方面,在本发明提供的上述预警工单生成方法中,根据格式转换后的运行数据,得到平台健康度指标数据,包括:
14、按照设定规则对格式转换后的运行数据进行计算,得到设备负载,平台负载和稳定性指标;
15、对设备负载,平台负载和稳定性指标中各指标项分别进行归一化处理,并加权累加得到最终得分值。
16、另一方面,在本发明提供的上述预警工单生成方法中,在得到设备负载的过程中,包括:
17、统计处理器和内存平均利用率超过门限值的数据占比,得到计算设备负载率;
18、统计处理器和内存平均利用率的标准差,得到计算设备负载平衡度;
19、在得到平台负载的过程中,包括:
20、根据云中心平台超配标准,计算平台超配比;
21、根据处理器分配率超限的主机聚合数与所有主机聚合数的比值,得到处理器分配率超标率;
22、根据内存分配率超限的主机聚合数与所有主机聚合数的比值,得到内存分配率超标率;
23、根据相应利用率的资源池个数与所有资源池总个数的比值,得到资源池高利用率占比;
24、在得到稳定性指标的过程中,包括:
25、根据云中心平台下各区域的告警量或工单情况,计算得到每个设备的告警密度和工单密度。
26、另一方面,在本发明提供的上述预警工单生成方法中,对设备负载,平台负载和稳定性指标中各指标项分别进行归一化处理,并加权累加得到最终得分值,包括:
27、通过标准化函数对所述计算设备负载率,所述计算设备负载平衡度,所述平台超配比,所述处理器分配率超标率,所述内存分配率超标率,所述资源池高利用率占比,所述告警密度和所述工单密度进行归一化处理;
28、将归一化处理结果与相应的权重进行加权累加,得到最终得分值。
29、另一方面,在本发明提供的上述预警工单生成方法中,在利用所述平台健康度指标对平台健康度模型进行训练之前,还包括:
30、基于逻辑回归模型,决策树或神经网络来构建平台健康度模型;所述平台健康度模型的输入为健康度指标数据,输出为故障风险概率。
31、另一方面,在本发明提供的上述预警工单生成方法中,根据各所述待测云中心平台下各区域存在的故障风险概率,自动生成预警工单,包括:
32、提取故障风险概率超过预警阈值的区域;
33、查询提取的区域对应的所述待测云中心平台;
34、根据查询的所述待测云中心平台的信息,自动生成对应的预警工单。
35、为了解决上述技术问题,本发明还提供一种预警工单生成装置,所述装置包括:
36、数据获取模块,用于获取云中心平台下不同区域的历史运行数据和对应的健康情况;
37、指标计算模块,用于对所述历史运行数据进行预处理,得到平台健康度指标数据;
38、模型训练模块,用于利用所述平台健康度指标数据和所述云中心平台的健康情况对平台健康度模型进行训练;
39、模型推理模块,用于将多个待测云中心平台下各区域的健康度指标数据输入至训练好的平台健康度模型,预测各所述待测云中心平台下各区域存在的故障风险概率;
40、工单生成模块,用于根据各所述待测云中心平台下各区域存在的故障风险概率,自动生成预警工单。
41、为了解决上述技术问题,本发明还提供一种预警工单生成设备,所述设备包括:
42、存储器,用于存储计算机程序;
43、处理器,用于执行所述计算机程序时实现上述的预警工单生成方法的步骤。
44、为了解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的预警工单生成方法的步骤。
45、从上述技术方案可以看出,本发明所提供的一种预警工单生成方法,该方法包括:获取云中心平台下不同区域的历史运行数据和对应的健康情况;对历史运行数据进行预处理,得到平台健康度指标数据;利用平台健康度指标数据和云中心平台的健康情况对平台健康度模型进行训练;将多个待测云中心平台下各区域的健康度指标数据输入至训练好的平台健康度模型,预测各待测云中心平台下各区域存在的故障风险概率;根据各待测云中心平台下各区域存在的故障风险概率,自动生成预警工单。
46、本发明的有益效果在于,本发明提供的上述预警工单生成方法,先获取云中心平台下不同区域的历史运行数据和对应的健康情况,对其进行预处理后得到平台健康度指标数据,然后利用平台健康度指标数据和对应的健康情况训练平台健康度模型,训练好的平台健康度模型可以实现对云中心潜在故障的预测,并据此生成预警工单,这样通过引入平台健康度模型和预警工单自动生成机制,能够迅速处理大量云中心平台数据,减少处理时间,同时也大幅减少人工干预的主观性和时间消耗,智能化地生成预警工单,提高预警工单生成的准确性和效率,降低系统故障的风险,提升整个系统的自动化水平,从而提高云中心的运维效率和响应速度。
47、此外,本发明还针对预警工单生成方法提供了相应的预警工单生成装置、预警工单生成设备及计算机可读存储介质,与上述提到的预警工单生成方法具有相同或相对应的技术特征,效果同上。
1.一种预警工单生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的预警工单生成方法,其特征在于,对所述历史运行数据进行预处理,得到平台健康度指标数据,包括:
3.根据权利要求2所述的预警工单生成方法,其特征在于,根据格式转换后的运行数据,得到平台健康度指标数据,包括:
4.根据权利要求3所述的预警工单生成方法,其特征在于,在得到设备负载的过程中,包括:
5.根据权利要求4所述的预警工单生成方法,其特征在于,对设备负载,平台负载和稳定性指标中各指标项分别进行归一化处理,并加权累加得到最终得分值,包括:
6.根据权利要求1所述的预警工单生成方法,其特征在于,在利用所述平台健康度指标对平台健康度模型进行训练之前,还包括:
7.根据权利要求1所述的预警工单生成方法,其特征在于,根据各所述待测云中心平台下各区域存在的故障风险概率,自动生成预警工单,包括:
8.一种预警工单生成装置,其特征在于,所述装置包括:
9.一种预警工单生成设备,其特征在于,所述设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的预警工单生成方法的步骤。