本技术涉及数据处理,尤其涉及一种日志数量变化监控方法、装置、存储介质及计算机设备。
背景技术:
1、计算机系统通常采用监控域来监控和管理的服务器、应用程序、网络设备等。其中,监控域产生的日志数据是系统运行状况、诊断问题和优化性能的宝贵资源,因此可以通过对日志数据的监控来保证系统的可靠性和稳定性。例如,在正常时间段日志数量的变化往往是平滑的,不会突增或者突降的大范围波动,如果日志数量突然发生突增大概率是有异常的发生。
2、为适应不同的业务需求,计算机系统经常需要变更配置,此时系统将由于配置变更或放量等动作,导致特定业务日志突然增加,从而引起生成日志的报错量增加,进而影响系统的正常运行。然而,现有的方法在对系统的运行状况进行监控时,通常只关注系统业务的达成情况,导致系统在突发情况下无法及时发现和解决问题,进而影响系统的稳定运行。
技术实现思路
1、本技术的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中在对系统的运行状况进行监控时,通常只关注系统业务的达成情况,导致系统在突发情况下无法及时发现和解决问题,进而影响系统的稳定运行的技术缺陷。
2、本技术提供了一种日志数量变化监控方法,其特征在于,所述方法包括:
3、获取每一监控域在当前时间段内生成的第一错误日志数量,以及确定每一监控域的异常日志阈值;
4、对各个监控域中第一错误日志数量大于对应的异常日志阈值的监控域进行异常标记,得到异常监控域,并基于所述异常监控域发起异常警告;
5、继续获取所述异常监控域在下一时间段内生成的第二错误日志数量和第一错误日志比值,并基于所述第二错误日志数量和所述第一错误日志比值判断所述异常监控域是否满足预设自愈条件;
6、若是,则取消所述异常监控域的异常标记和异常警告;
7、若否,则基于所述异常监控域发起持续异常警告。
8、可选地,所述获取每一监控域在当前时间段内生成的第一错误日志数量,包括:
9、确定错误日志对应的查询条件,并根据当前时间段和所述查询条件生成查询语句;
10、利用所述查询语句从各个监控域对应的存储空间中统计得到每一监控域在所述当前时间段内生成的第一错误日志数量。
11、可选地,所述确定每一监控域的异常日志阈值,包括:
12、针对每一监控域,确定该监控域的域类型,并基于所述域类型计算该监控域的异常日志阈值。
13、可选地,所述域类型包括作业域和服务域;
14、所述基于所述域类型计算该监控域的异常日志阈值,包括:
15、当所述域类型为作业域时,获取该监控域在上一执行周期中与所述当前时间段对应的时间段内产生的错误日志数量,将所述错误日志数量与第一预设阈值相加,并将相加结果作为该监控域的异常日志阈值;
16、当所述域类型为服务域时,获取该监控域在所述当前时间段的上一时间段内产生的错误日志数量,将所述错误日志数量与所述第一预设阈值相加,并将相加结果作为该监控域的异常日志阈值。
17、可选地,所述获取所述异常监控域在下一时间段内生成的第一错误日志比值,包括:
18、获取所述异常监控域在下一时间段内生成的正常日志数量,并将所述第二错误日志数量与所述正常日志数量之间的比值作为所述异常监控域在所述下一时间段时的第一错误日志比值。
19、可选地,所述基于所述第二错误日志数量和所述第一错误日志比值判断所述异常监控域是否满足预设自愈条件,包括:
20、获取所述异常监控域在当前时间段内生成的第一错误日志数量和第二错误日志比值;
21、对所述第二错误日志数量与所述异常监控域的第一错误日志数量进行做差,得到第一差值,以及,对所述第一错误日志比值和所述第二错误日志比值进行做差,得到第二差值;
22、根据所述第一差值和所述第二差值判断所述异常监控域是否满足预设自愈条件。
23、可选地,所述根据所述第一差值和所述第二差值判断所述异常监控域是否满足预设自愈条件,包括:
24、判断所述异常监控域是否满足所述第一差值小于第二预设阈值或所述第二差值小于第三预设阈值的条件;
25、若是,则确认所述异常监控域满足预设自愈条件;
26、若否,则确认所述异常监控域不满足预设自愈条件。
27、本技术还提供了一种日志数量变化监控装置,包括:
28、数据获取模块,用于获取每一监控域在当前时间段生成内的第一错误日志数量,以及确定每一监控域的异常日志阈值;
29、异常标记模块,用于对各个监控域中第一错误日志数量大于对应的异常日志阈值的监控域进行异常标记,得到异常监控域,并基于所述异常监控域发起异常警告;
30、条件判断模块,用于继续获取所述异常监控域在下一时间段内生成的第二错误日志数量和第一错误日志比值,并基于所述第二错误日志数量和所述第一错误日志比值判断所述异常监控域是否满足预设自愈条件;
31、第一控制模块,用于当所述异常监控域满足预设自愈条件时,取消所述异常监控域的异常标记和异常警告;
32、第二控制模块,用于当所述异常监控域不满足预设自愈条件时,基于所述异常监控域发起持续异常警告。
33、本技术还提供了一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述日志数量变化监控方法的步骤。
34、本技术还提供了一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
35、所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述日志数量变化监控方法的步骤。
36、从以上技术方案可以看出,本技术实施例具有以下优点:
37、本技术提供的日志数量变化监控方法、装置、存储介质及计算机设备,在对系统中实时生成的日志数量变化进行监控时,可以获取每一监控域在当前时间段生成内的第一错误日志数量,以及确定每一监控域的异常日志阈值,从而可以得到监控域生成的日志是否存在异常变化的判断依据;接着可以对各个监控域中第一错误日志数量大于对应的异常日志阈值的监控域进行异常标记,得到异常监控域,并基于异常监控域发起异常警告,这样在系统中存在突发情况时可以及时提醒开发人员发现和解决问题;之后还可以继续获取异常监控域在下一时间段内生成的第二错误日志数量和第一错误日志比值,并基于第二错误日志数量和第一错误日志比值判断异常监控域是否满足预设自愈条件,进而可以根据判断结果对异常监控域采取不同的应对措施,从而提高系统的监控质量,进而提高系统稳定性。例如,当异常监控域满足预设自愈条件时,说明该异常监控域以恢复正常状态,此时可以取消异常监控域的异常标记和异常警告,以减少人力资源浪费;当异常监控域不满足预设自愈条件时,说明该异常监控域依旧处于异常状态,此时需要基于该异常监控域发起持续异常警告,以通知开发人员尽快解决该异常问题,避免影响系统的稳定运行。本技术可以通过日志数量变化及时发现系统中监控域的异常问题,保证了系统运行的稳定性,并且,该方法可以不需要对监控域进行任何配置,其逻辑可以适配于所有类型的监控域。
1.一种日志数量变化监控方法,其特征在于,所述方法包括:
2.根据权利要求1所述的日志数量变化监控方法,其特征在于,所述获取每一监控域在当前时间段内生成的第一错误日志数量,包括:
3.根据权利要求1所述的日志数量变化监控方法,其特征在于,所述确定每一监控域的异常日志阈值,包括:
4.根据权利要求3所述的日志数量变化监控方法,其特征在于,所述域类型包括作业域和服务域;
5.根据权利要求1所述的日志数量变化监控方法,其特征在于,所述获取所述异常监控域在下一时间段内生成的第一错误日志比值,包括:
6.根据权利要求1所述的日志数量变化监控方法,其特征在于,所述基于所述第二错误日志数量和所述第一错误日志比值判断所述异常监控域是否满足预设自愈条件,包括:
7.根据权利要求6所述的日志数量变化监控方法,其特征在于,所述根据所述第一差值和所述第二差值判断所述异常监控域是否满足预设自愈条件,包括:
8.一种日志数量变化监控装置,其特征在于,包括:
9.一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述日志数量变化监控方法的步骤。
10.一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
