服务器发生错误的预测方法、装置、存储介质及电子设备与流程

allin2025-12-25  64


本技术实施例涉及计算机领域,具体而言,涉及一种服务器发生错误的预测方法、装置、存储介质及电子设备、计算机程序产品。


背景技术:

1、服务器的内存模块的故障频发成为了系统管理员和运维人员面临的一大挑战。内存故障不仅可能导致数据丢失和系统性能下降,更有可能触发整个系统的宕机,给用户带来严重的服务中断影响和经济损失。

2、在相关技术中,通常根据内存模块发生可纠正错误的次数和频率预测服务器是否发生错误。然而,仅根据内存模块发生可纠正错误的次数和频率预测服务器是否发生错误存在预测不准确的问题。

3、针对相关技术中存在上述问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种服务器发生错误的预测方法、装置、存储介质及电子设备、计算机程序产品,以至少解决相关技术中存在预测服务器发生错误准确率低的问题。

2、根据本技术的一个实施例,提供了一种服务器发生错误的预测方法,包括:获取目标服务器的历史数据,其中,所述历史数据为在当前时间点之前预定时间段内的数据;基于所述历史数据确定在所述预定时间段内发生可纠正错误的位置信息;获取预测目标服务器的内存会发生不可纠正错误的故障层级中包括的目标子层级;基于所述位置信息预测所述目标服务器的内存在所述目标子层级是否会发生不可纠正错误,得到第一预测结果;基于所述第一预测结果确定所述目标服务器的内存在所述目标子层级会发生所述不可纠正错误的目标概率;基于所述目标概率预测所述目标服务器是否会发生所述不可纠正错误。

3、在一个示例性实施例中,所述基于所述历史数据确定在所述预定时间段内发生所述可纠正错误的位置信息,包括:基于所述历史数据确定在所述预定时间段内发生所述可纠正错误的物理地址;基于所述物理地址确定所述位置信息。

4、在一个示例性实施例中,所述基于所述物理地址确定所述位置信息,包括:解析所述物理地址,得到发生所述可纠正错误的动态随机存取存储器地址;将所述动态随机存取存储器地址确定为所述位置信息。

5、在一个示例性实施例中,所述解析所述物理地址,得到发生所述可纠正错误的动态随机存取存储器地址,包括:解析所述物理地址,得到发生所述可纠正错误的存储块的地址、内存颗粒的地址、存储阵列的地址、内存子阵列的地址以及存储单元的地址,其中,所述目标服务器的内存包括所述存储块,所述存储块包括所述内存颗粒,所述内存颗粒包括存储阵列,所述存储阵列包括所述内存子阵列,所述内存子阵列包括所述存储单元;将所述存储块的地址、所述内存颗粒的地址、所述存储阵列的地址、所述内存子阵列的地址以及所述存储单元的地址确定为所述动态随机存取存储器地址。

6、在一个示例性实施例中,所述基于所述位置信息预测所述目标服务器的内存在所述目标子层级是否会发生不可纠正错误,得到第一预测结果,包括:在所述目标子层级包括存储阵列层级的情况下,确定所述位置信息中包括的第二地址,其中,所述第二地址为同一存储块中的发生所述可纠正错误的存储阵列的地址,基于所述第二地址中包括的属于同一目标存储阵列的地址的第一数量预测所述目标服务器的内存在所述目标子层级是否会发生所述不可纠正错误,得到第一预测结果;在所述目标子层级包括内存颗粒层级的情况下,基于所述位置信息确定同一内存颗粒中发生所述可纠正错误的目标存储阵列的第二数量,以及所述目标存储阵列中发生所述可纠正错误的第三数量,基于所述第二数量以及所述第三数量预测所述目标服务器的内存在所述目标子层级是否会发生所述不可纠正错误,得到第一预测结果;在所述目标子层级包括内存子阵列层级的情况下,基于所述位置信息确定属于同一存储阵列的内存子阵列中发生所述可纠正错误的内存子阵列的第三地址,基于所述第三地址中包括的存储单元的第四数量预测所述目标服务器的内存在所述目标子层级是否会发生所述不可纠正错误,得到第一预测结果。

7、在一个示例性实施例中,所述基于所述第二地址中包括的属于同一目标存储阵列的地址的第一数量预测所述目标服务器的内存在所述目标子层级是否会发生所述不可纠正错误,得到第一预测结果,包括:在所述第一数量大于或等于第一阈值的情况下,确定所述第一预测结果包括所述目标服务器的内存在所述目标子层级会发生所述不可纠正错误;在所述第一数量小于所述第一阈值的情况下,确定所述第一预测结果包括所述目标服务器的内存在所述目标子层级不会发生所述不可纠正错误。

8、在一个示例性实施例中,所述基于所述第二数量以及所述第三数量预测所述目标服务器的内存在所述目标子层级是否会发生所述不可纠正错误,得到第一预测结果;在所述第二数量大于或等于第二阈值,且所述第三数量大于或等于第三阈值的情况下,确定所述第一预测结果包括所述目标服务器的内存在所述目标子层级会发生所述不可纠正错误;在所述第二数量小于所述第二阈值,和/或,所述第三数量小于所述第三阈值的情况下,确定所述第一预测结果包括所述目标服务器的内存在所述目标子层级不会发生所述不可纠正错误。

9、在一个示例性实施例中,所述基于所述第三地址中包括的存储单元的第四数量预测所述目标服务器的内存在所述目标子层级是否会发生所述不可纠正错误,得到第一预测结果,包括:在所述第四数量大于或等于第四阈值的情况下,确定所述第一预测结果包括所述目标服务器的内存在所述目标子层级会发生所述不可纠正错误;在所述第四数量小于所述第四阈值的情况下,确定所述第一预测结果包括所述目标服务器的内存在所述目标子层级不会发生所述不可纠正错误。

10、在一个示例性实施例中,所述基于所述第一预测结果确定所述目标服务器的内存在所述目标子层级会发生所述不可纠正错误的目标概率,包括:在所述目标子层级仅包括一个子层级的情况下,将所述第一预测结果转换为第一数值,将所述第一数值与目标权重的乘积确定为所述目标概率;在所述目标子层级包括多个子层级的情况下,确定每个所述子层级对应的第一权重,将每个所述子层级对应的所述第一预测结果转换为第二数值,基于所述第一权重以及所述第二数值进行加权求和,得到所述目标概率。

11、在一个示例性实施例中,基于所述目标概率的融合结果预测所述目标服务器是否会发生所述不可纠正错误,包括:确定所述目标置信度对应的第二权重,以及所述目标概率对应的第三权重;确定所述目标置信度与所述第二权重的第一乘积,以及确定所述目标概率与所述第三权重的第二乘积;基于所述第一乘积与所述第二乘积的和确定为所述融合结果预测所述目标服务器是否会发生所述不可纠正错误。

12、在一个示例性实施例中,在获取目标服务器的历史数据之前,所述方法还包括:在接收到基本输入输出系统发送的预测指令的情况下,确定所述目标服务器的内存发生所述可纠正错误,其中,所述预测指令为所述基本输入输出系统在检测到所述目标服务器的内存发生所述可纠正错误的情况下发送的指令。

13、在一个示例性实施例中,在基于所述目标概率预测所述目标服务器是否会发生所述不可纠正错误之后,所述方法还包括:在基于所述融合结果预测所述目标服务器的内存会发生所述不可纠正错误的情况下,执行告警操作。

14、根据本技术的另一个实施例,提供了一种服务器发生错误的预测装置,包括:获取目标服务器的历史数据,其中,所述历史数据为在当前时间点之前预定时间段内的数据;基于所述历史数据确定在所述预定时间段内发生可纠正错误的位置信息;获取预测目标服务器的内存会发生不可纠正错误的故障层级中包括的目标子层级;基于所述位置信息预测所述目标服务器的内存在所述目标子层级是否会发生不可纠正错误,得到第一预测结果;基于所述第一预测结果确定所述目标服务器的内存在所述目标子层级会发生所述不可纠正错误的目标概率;基于所述目标概率预测所述目标服务器是否会发生所述不可纠正错误。

15、根据本技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

16、根据本技术的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

17、根据本技术的又一个实施例,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。

18、通过本技术,获取目标服务器的历史数据,其中,历史数据为在当前时间点之前预定时间段内的数据;基于历史数据确定在预定时间段内发生可纠正错误的位置信息;获取预测目标服务器的内存会发生不可纠正错误的故障层级中包括的目标子层级;基于位置信息预测目标服务器的内存在目标子层级是否会发生不可纠正错误,得到第一预测结果;基于第一预测结果确定目标服务器的内存在目标子层级会发生不可纠正错误的目标概率;基于目标概率预测目标服务器是否会发生不可纠正错误。由于可以根据历史数据预测目标服务器的内存在故障层级中包括的目标子层级是否会发生不可纠正错误,得到第一预测结果,并根据第一预测结果确定目标服务器的内存在目标子层级会发生不可纠正错误的目标概率,根据目标概率预测目标服务器是否会发生不可纠正错误。实现了根据发生可纠正错误的位置信息预测故障层级中包括的每个目标子层级是否会发生不可纠正错误,提高了错误预测的精确率。因此,可以解决相关技术中存在的预测服务器发生错误准确率低的问题,达到提高预测服务器发生错误的准确率的效果。


技术特征:

1.一种服务器发生错误的预测方法,其特征在于,

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求5所述的方法,其特征在于,

7.根据权利要求5所述的方法,其特征在于,

8.根据权利要求5所述的方法,其特征在于,

9.根据权利要求1所述的方法,其特征在于,

10.根据权利要求1所述的方法,其特征在于,

11.根据权利要求1所述的方法,其特征在于,

12.根据权利要求1所述的方法,其特征在于,

13.一种计算机可读存储介质,其特征在于,

14.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,

15.一种计算机程序产品,包括计算机程序,其特征在于,


技术总结
本申请实施例提供了一种服务器发生错误的预测方法、装置、存储介质及电子设备,其中,该方法包括:获取目标服务器的历史数据;基于历史数据确定在预定时间段内发生可纠正错误的位置信息;获取预测目标服务器的内存会发生不可纠正错误的故障层级中包括的目标子层级;基于位置信息预测目标服务器的内存在目标子层级是否会发生不可纠正错误,得到第一预测结果;基于第一预测结果确定目标服务器的内存在目标子层级会发生不可纠正错误的目标概率;基于目标概率预测目标服务器是否会发生不可纠正错误。通过本申请,解决了预测服务器发生错误准确率低的问题。

技术研发人员:张昭,刘宝阳,陈超凡,王兴隆,李金锋
受保护的技术使用者:苏州元脑智能科技有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-25375.html

最新回复(0)