针对互联网系统的监控告警方法及系统、设备及介质与流程

allin2023-02-19  133



1.本发明涉及互联网领域。更具体地,涉及一种针对互联网系统的监控告警方法及系统、设备及介质。


背景技术:

2.在现代社会it技术高速发展的背景下,it运维与监控已经成为it公司重要组成部分,对于保障it产品高效稳定的运行提供不可或缺的作用。通过针对产品、服务器等指标的监控,可以快速发现和处理故障,将问题影响最小化。
3.it系统监控告警的处理的原则,是快速的修复故障,降低问题的影响。查找故障的根本原因的优先级是低于解决问题故障。如重启系统或服务器可以快速修复问题,问题处理的方式应该是优先采用重启系统或者服务器。所以it监控告警处理的方法选择是告警问题处理消耗时间的重要因素,而同产品的类似问题处理方式是可以通过经验沉淀和总结的。现有it监控方法和系统更多描述的是监控手段等,不同运维人员接收到告警信息后,依然可能存在因处理方式不一而导致处理问题不够及时,扩大问题导致的损失。


技术实现要素:

4.本发明的目的在于提供一种针对互联网系统的监控告警方法及系统、设备及介质,以解决现有技术存在的问题中的至少一个。
5.为达到上述目的,本发明采用下述技术方案:
6.本发明第一方面提供了一种针对互联网系统的监控告警方法,包括:
7.实时分析和监控数据库列表中的指定的监控项是否触发告警,若触发告警则根据监控项处理策略生成告警信息和告警处理策略;
8.向用户发送所述告警信息和告警处理策略以实现故障节点处理;
9.接收来自用户的告警处理信息并根据所述告警处理信息生成告警处理分析报告。
10.进一步地,所述实时分析和监控数据库列表中的指定的监控项是否触发告警包括:
11.通过中间件层监控单元获取所述互联网系统的中间件的监控数据,根据数据库列表中的监控项触发策略判断其是否触发告警并输出判断结果。
12.进一步地,所述实时分析和监控数据库列表中的指定的监控项是否触发告警还包括:
13.利用业务层监控单元获取互联网系统中业务层的监测数据,根据数据库列表中的监控项触发策略对其进行拨测以判断其是否触发告警并输出判断结果。
14.进一步地,所述告警处理策略为根据告警对象和数据库列表中的监控项触发策略进行匹配得到的指引用户进行标准化操作的处理指示。
15.本发明第二方面提供了一种针对互联网系统的监控告警系统,包括:
16.监控策略录入单元,用于录入监控项触发策略和监控项处理策略,并通过监控告
警确认服务接口写入监控管理单元和数据库;
17.监控单元,用于实时获取监控对象的状态,并根据所述监控项触发策略确认监控对象是否触发告警,若触发告警则通过监控告警确认服务接口将告警信息发送至所述监控管理单元;
18.监控管理单元,用于根据所述监控单元输出的告警信息和监控项处理策略得到告警处理策略,并将所述告警信息和告警处理策略通过通知模块发送至用户端界面;
19.告警确认单元,用于提供告警项处理信息并接收来自用户的告警处理信息。
20.进一步地,所述系统还包括:
21.运维分析单元,用于接收所述告警处理信息并根据所述告警处理信息生成告警处理分析报告。
22.进一步地,所述监控单元包括中间件层监控单元和业务层监控单元,所述中间件层监控单元获取所述互联网系统的中间件的监控数据,并根据数据库列表中的监控项触发策略判断其是否触发告警;
23.所述业务层监控单元获取互联网系统中业务层的监测数据,并根据数据库列表中的监控项触发策略对其进行拨测,并输出拨测结果。
24.进一步地,所述告警项处理信息包括告警处理时效要求、监控处理步骤、监控项验证链接、监控项日志索引和监控项协助处理人员信息;
25.所述告警处理时效为根据对告警定义得到的告警截止时间,用于协助用户明确告警处理时效;
26.所述监控处理步骤是根据告警对象得到的逐步的操作步骤,用于指引用户逐步完成标准化操作;
27.所述监控项验证链接为本监控项的相关链接,包括业务监控的链接和中间件监控的心跳页面,通过访问所述监控项验证链接能够得到告警对象的当前状态;
28.所述监控项日志索引包括告警时间错误日志和对应日志中心索引,用于用户根据日志进行问题分析;
29.所述监控项协助处理人员信息包含处理人员联系电话、邮箱和快捷自动生成邮件模板,方便需要更换人员处理时,快速进行信息告知;
30.所述告警处理信息包括告警处理人员、处理完成时间、处理过程信息和处理方式。
31.本发明第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明第一方面提供的针对互联网系统的监控告警方法。
32.本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面提供的针对互联网系统的监控告警方法。
33.本发明的有益效果如下:
34.本技术所提供的方案,针对告警项目生成告警处理策略,为运维人员提供清晰的处理思路和时效指引,大大提高了告警处理的准确性,且通过记录的处理信息,进行系统薄弱点以及处理人员工作能力的分析,进行持续总结和提升,对监控告警能力的持续提高具有重要意义。
附图说明
35.下面结合附图对本发明的具体实施方式作进一步详细的说明。
36.图1示出本发明的一个实施例提供的一种互联网系统的监控告警方法的流程图;
37.图2为本发明的一个实施例提供的一种基互联网系统的监控告警系统的模块图;
38.图3示出实现本发明实施例提供的方法的计算机设备的结构示意图。
具体实施方式
39.为了更清楚地说明本发明,下面结合实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
40.目前,现有的监控方法和系统侧重于针对监控方法,监控触发策略的研究和深入,针对监控触发后的处理环节无深入涉及,从而导致运维工程师最终处理时存在盲目性和随机性的风险,间接增加告警带来的损失加大的风险。
41.发明人基于上述技术问题,提出了一种针对互联网系统的监控告警方法。
42.如图1所示,本发明的一个实施例提出了一种针对互联网系统的监控告警方法,包括:
43.s101:实时分析和监控数据库列表中的指定的监控项是否触发告警,若触发告警则根据监控项处理策略生成告警信息和告警处理策略;
44.s102:向用户发送所述告警信息和告警处理策略以实现故障节点处理;
45.s103:接收来自用户的告警处理信息并根据所述告警处理信息生成告警处理分析报告。
46.在一种可能的实现方式中,所述实时分析和监控数据库列表中的指定的监控项是否触发告警包括:通过中间件层监控单元获取所述互联网系统的中间件的监控数据,根据数据库列表中的监控项触发策略判断其是否触发告警并输出判断结果。
47.在一个具体的实施例中,所述实时分析和监控数据库列表中的指定的监控项是否触发告警还包括:
48.利用业务层监控单元获取互联网系统中业务层的监测数据,根据数据库列表中的监控项触发策略对其进行拨测以判断其是否触发告警并输出判断结果,其中,
49.所述中间件层监控单元采用zabbix技术。
50.在一个具体的实施例中,监控项触发策略例如包含监控对象、监控触发阀值、频次和告警通知策略,监控处理策略例如包含监控处理时效要求、监控处理步骤、监控项验证链接、监控项日志索引和监控项协助处理人员信息。
51.在一种可能的实现方式中,所述告警处理策略为根据告警对象和数据库列表中的监控项触发策略进行匹配得到的指引用户进行标准化操作的处理指示。本方案针对告警项目生成告警处理策略,为运维人员提供了清晰的处理思路和时效指引,大大提高了告警处理的准确性。
52.在一个具体的实施例中,通过微信、短信或电话方式向用户发送所述告警信息和告警处理策略,
53.在一个具体的实施例中,所述告警处理策略包括例如处理步骤、告警项验证链接、
告警项日志查看链接、告警项处理时间要求、告警项升级处理人员和联络信息。
54.在一个具体的实施例中,所述告警处理信息例如包括告警处理时效要求、监控处理步骤、监控项验证链接、监控项日志索引和监控项协助处理人员信息。
55.由于运维的处理具有重复性,在运维故障的处理时,抢修过程是重复的,因此明确处理步骤,可以大大提高处理速度和质量。
56.在一个具体的实施例中,所述告警处理时效为根据对告警项的定义得到的告警截止时间,用于协助用户明确告警处理时效;
57.所述监控处理步骤是根据告警对象得到的逐步的操作步骤,用于指引用户逐步完成标准化操作;
58.所述监控项验证链接为本监控项的相关链接,包括业务监控的链接和中间件监控的心跳页面,通过访问所述监控项验证链接能够得到告警对象的当前状态;
59.所述监控项日志索引包括告警时间错误日志和对应日志中心索引,用于用户根据日志进行问题分析;
60.所述监控项协助处理人员信息包含处理人员联系电话、邮箱和快捷自动生成邮件模板,方便需要更换人员处理时,快速进行信息告知;
61.所述告警处理信息包括告警处理人员、处理完成时间、处理过程信息和处理方式。
62.在一个具体的实施例中,所述告警分析报告为根据告警项、时间区域、人员、告警项级别等多个维度进行告警分析得出的分析报告,能够根据分析报告确认监控告警的高发区域和难点区域,便于进行定向提升,对监控项处理策略和监控项触发策略做出针对性优化,从而推进公司运维保障效果持续提升。
63.如图2所示,本发明的一个实施例提出了一种针对互联网系统的监控告警系统,包括:
64.监控单元202,用于实时获取监控对象的状态,并根据所述监控项触发策略确认监控对象是否触发告警,若触发告警则通过监控告警确认服务接口将告警信息发送至所述监控管理单元;
65.监控管理单元204,用于根据所述监控单元输出的告警信息和监控项处理策略得到告警处理策略,并将所述告警信息和告警处理策略通过通知模块发送至用户端界面;
66.告警确认单元206,用于提供告警项处理信息并接收来自用户的告警处理信息。
67.在一个具体的实施例中,如图2所示,所述系统还包括:
68.监控策略录入单元201,用于录入监控项触发策略和监控项处理策略,并通过监控告警确认服务接口写入监控管理单元和数据库。
69.在一个具体的实施例中,所示系统还包括:
70.运维分析单元208,用于接收所述告警处理信息并根据所述告警处理信息生成告警处理分析报告。
71.在一个具体的实施例中,管理员通过监控策略录入单元201进行监控项触发策略和监控项处理策略的录入,其中,
72.监控项触发策略例如包含监控对象、监控触发阀值、频次、告警通知策略等,监控处理策略例如包含监控处理时效要求、监控处理步骤、监控项验证链接、监控项日志索引、监控项协助处理人员信息等。所述监控告警系统通过监控告警确认服务接口将所述监控项
触发策略和监控项处理策略写入监控管理单元和数据库中。
73.在一种可能的实现方式中,所述监控单元202包括中间件层监控单元和业务层监控单元,所述中间件层监控单元获取所述互联网系统的中间件的监控数据,并根据数据库列表中的监控项触发策略判断其是否触发告警;
74.所述业务层监控单元获取互联网系统中业务层的监测数据,并根据数据库列表中的监控项触发策略对其进行拨测,并输出拨测结果。
75.在一种可能的实现方式中,所述告警项处理信息包括告警处理时效要求、监控处理步骤、监控项验证链接、监控项日志索引和监控项协助处理人员信息;
76.所述告警处理时效为根据对告警项的定义得到的告警截止时间,用于协助用户明确告警处理时效;
77.所述监控处理步骤是根据告警对象得到的逐步的操作步骤,用于指引用户逐步完成标准化操作;
78.所述监控项验证链接为本监控项的相关链接,包括业务监控的链接和中间件监控的心跳页面,通过访问所述监控项验证链接能够得到告警对象的当前状态;
79.所述监控项日志索引包括告警时间错误日志和对应日志中心索引,用于用户根据日志进行问题分析;
80.所述监控项协助处理人员信息包含处理人员联系电话、邮箱和快捷自动生成邮件模板,方便需要更换人员处理时,快速进行信息告知;
81.所述告警处理信息包括告警处理人员、处理完成时间、处理过程信息和处理方式。
82.在一个具体的实施例中,运维人员通过监控告警系统的监控告警确认页面接收所述监控处理信息
83.如图3所示,本发明的第三个实施例提供的一种计算机设备的结构示意图。适于用来实现上述实施例提供的针对互联网系统的监控告警方法的计算机设备,包括中央处理模块(cpu),其可以根据存储在只读存储器(rom)中的程序或者从存储部分加载到随机访问存储器(ram)中的程序而执行各种适当的动作和处理。在ram中,还存储有计算机设备操作所需的各种程序和数据。cpu、rom以及ram通过总线被此相连。输入/输入(i/o)接口也连接至总线。
84.以下部件连接至i/o接口:包括键盘、鼠标等的输入部分;包括诸如液晶显示器(lcd)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至i/o接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
85.特别地,根据本实施例,上文流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括有形地包含在计算机可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。
86.附图中的流程图和示意图,图示了本实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或示意图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规
定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,示意图和/或流程图中的每个方框、以及示意和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
87.本技术的第四个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现:
88.s101:实时分析和监控数据库列表中的指定的监控项是否触发告警,若触发告警则根据监控项处理策略生成告警信息和告警处理策略;
89.s102:向用户发送所述告警信息和告警处理策略以实现故障节点处理;
90.s103:接收来自用户的告警处理信息并根据所述告警处理信息生成告警处理分析报告。
91.在实际应用中,所述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
92.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
93.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
94.可以以一种或多种程序设计语言或其组合来编写用于执行本技术操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
95.显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于本领域的普通技术人员来说,在上述说明的基础上还可以
做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

技术特征:
1.一种针对互联网系统的监控告警方法,其特征在于,包括:实时分析和监控数据库列表中指定的监控项是否触发告警,若触发告警则根据监控项处理策略生成告警信息和告警处理策略;向用户发送所述告警信息和告警处理策略以实现故障节点处理;接收来自用户的告警处理信息并根据所述告警处理信息生成告警处理分析报告。2.根据权利要求1所述的方法,其特征在于,所述实时分析和监控数据库列表中指定的监控项是否触发告警包括:通过中间件层监控单元获取所述互联网系统的中间件的监控数据,根据数据库列表中的监控项触发策略判断其是否触发告警并输出判断结果。3.根据权利要求2所述的方法,其特征在于,所述实时分析和监控数据库列表中指定的监控项是否触发告警还包括:利用业务层监控单元获取互联网系统中业务层的监测数据,根据数据库列表中的监控项触发策略对其进行拨测以判断其是否触发告警并输出判断结果。4.根据权利要求1所述的方法,其特征在于,所述告警处理策略为根据告警对象和数据库列表中的监控项触发策略进行匹配得到的指引用户进行标准化操作的处理指示。5.一种针对互联网系统的监控告警系统,其特征在于,包括:监控单元,用于实时获取监控对象的状态,并根据监控项触发策略确认监控对象是否触发告警,若触发告警则通过监控告警确认服务接口将告警信息发送至所述监控管理单元;监控管理单元,用于根据所述监控单元输出的告警信息和监控项处理策略得到告警处理策略,并将所述告警信息和告警处理策略通过通知模块发送至用户端界面;告警确认单元,用于提供告警项处理信息并接收来自用户的告警处理信息。6.根据权利要求5所述的系统,其特征在于,所述系统还包括:监控策略录入单元,用于录入监控项触发策略和监控项处理策略,并通过监控告警确认服务接口写入监控管理单元和数据库;运维分析单元,用于接收所述告警处理信息并根据所述告警处理信息生成告警处理分析报告。7.根据权利要求5所述的系统,其特征在于,所述监控单元包括中间件层监控单元和业务层监控单元,所述中间件层监控单元获取所述互联网系统的中间件的监控数据,并根据数据库列表中的监控项触发策略判断其是否触发告警;所述业务层监控单元获取互联网系统中业务层的监测数据,并根据数据库列表中的监控项触发策略对其进行拨测,并输出拨测结果。8.根据权利要求5所述的系统,其特征在于,所述告警项处理信息包括告警处理时效要求、监控处理步骤、监控项验证链接、监控项日志索引和监控项协助处理人员信息;所述告警处理时效为根据对告警项的定义得到的告警截止时间,用于协助用户明确告警处理时效;
所述监控处理步骤是根据告警对象得到的逐步的操作步骤,用于指引用户逐步完成标准化操作;所述监控项验证链接为本监控项的相关链接,包括业务监控的链接和中间件监控的心跳页面,通过访问所述监控项验证链接能够得到告警对象的当前状态;所述监控项日志索引包括告警时间错误日志和对应日志中心索引,用于用户根据日志进行问题分析;所述监控项协助处理人员信息包含处理人员联系电话、邮箱和快捷自动生成邮件模板,方便需要更换人员处理时,快速进行信息告知;所述告警处理信息包括告警处理人员、处理完成时间、处理过程信息和处理方式。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4任一项所述的方法。10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。

技术总结
本发明实施例公开一种针对互联网系统的监控告警方法及系统、设备及介质,所述方法包括:实时分析和监控数据库列表中的指定的监控项是否触发告警,若触发告警则根据监控项处理策略生成告警信息和告警处理策略;向用户发送所述告警信息和告警处理策略以实现故障处理;接收来自用户的告警处理信息并根据所述告警处理信息生成告警处理分析报告。本方案针对告警项目生成告警处理策略,为运维人员提供清晰的处理思路和时效指引,大大提高了告警处理的准确性。准确性。准确性。


技术研发人员:艾沐
受保护的技术使用者:联通沃悦读科技文化有限公司
技术研发日:2022.02.18
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-5233.html

最新回复(0)