数据库告警抑制方法及相关装置与流程

allin2022-09-03  86



1.本发明涉及数据库领域,特别涉及一种数据库告警抑制方法及相关装置。


背景技术:

2.随着银行业务的高速发展,各种业务场景快速迭代。新兴技术在促进业务发展的同时又极大地增加了it系统的复杂度。为了应对高压力高并发,应用系统数据库机器的数量不断增加,相应的各种数据库故障应急处置面临着越来越大的压力。而故障发现最有效的手段是通过告警,由于机器数量众多,并且关系错综复杂,一个故障会导致多个告警。在重大故障发生时,触发大量告警形成风暴,在运维人员有限的情况下,大量的告警得不到及时处理。


技术实现要素:

3.鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的数据库告警抑制方法及相关装置。
4.第一方面,一种数据库告警抑制方法,包括:
5.获得当前的故障事件单;
6.通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;
7.根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。
8.结合第一方面,在某些可选的实施方式中,所述类别识别模型的训练过程,包括:
9.根据预先定义的不同事件类别,构建相应的分词字典,其中,所述事件类别包括数据库性能、数据库状态、数据库可用性和数据库容量,所述分词字典记录各所述事件类别对应的特征分词;
10.通过分词器调用所述分词字典,对各历史故障事件单进行分词处理,从而确定各所述历史故障事件单的特征分词;
11.分别根据各所述历史故障事件单的特征分词,对各所述历史故障事件单分别进行文本向量化,从而获得各所述历史故障事件单的向量特征;
12.将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型。
13.结合上一个实施方式,在某些可选的实施方式中,所述将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型,包括:
14.调用svm分类器,并将各所述历史故障事件单的向量特征输入至所述svm分类器进行训练,从而得到所述分类模型。
15.结合第一方面,在某些可选的实施方式中,所述告警压制规则的建立过程,包括:
16.从故障事件单库中获取各所述历史故障事件单;
17.通过所述类别识别模型,确定各所述历史故障事件单对应的事件类别,并从各所述历史故障事件单中分别抽取相应的细类关键字、故障开始时间和故障恢复时间;
18.从告警库中获取针对各所述历史故障事件单发送的历史告警信息,其中,一个所述历史故障事件单对应至少一条所述历史告警信息;
19.从各所述历史告警信息中分别提取相应的事件类别、细类关键字、故障开始时间和故障恢复时间;
20.根据各所述历史故障事件单的事件类别、细类关键字、故障开始时间和故障恢复时间,以及各所述历史告警信息的事件类别、细类关键字、故障开始时间和故障恢复时间,分别将各所述历史故障事件单与对应的历史告警信息进行关联,其中,一条所述历史告警信息关联一个所述历史故障事件单,一个所述历史故障事件单关联至少一条所述历史告警信息;
21.将各所述历史故障事件单和相关联的各历史告警信息,按不同事件类别分组输入至数据挖掘算法fp-growth,从而获得所述fp-growth的数据挖掘结果,其中,相同事件类别的历史故障事件单和相关联的历史告警信息划分为同一组,所述数据挖掘结果反映各所述历史告警信息与相应事件类别的关联度;
22.根据各所述历史告警信息与相应事件类别的关联度,建立所述告警压制规则。
23.结合上一个实施方式,在某些可选的实施方式中,所述根据各所述历史告警信息与相应事件类别的关联度,建立所述告警压制规则,包括:
24.针对任一所述事件类别,均执行:将相应的各历史告警信息按照相应关联度的大小,依次排列;
25.将关联度大于关联度阈值的历史告警信息设置为相应事件类别的可发送信息;
26.所述根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,包括:
27.根据所述事件类别,确定相应的可发送信息并发送。
28.结合上一个实施方式,在某些可选的实施方式中,在所述根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息之后,所述方法还包括:
29.根据所述告警压制规则当前对告警信息的压制情况,调整所述关联度阈值。
30.第二方面,一种数据库告警抑制装置,包括:当前事件单获得单元、事件类别识别单元和告警压制单元;
31.所述当前事件单获得单元、用于获得当前的故障事件单;
32.所述事件类别识别单元,用于通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;
33.所述告警压制单元,用于根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。
34.结合第二方面,在某些可选的实施方式中,所述装置还包括模型训练单元;
35.所述模型训练单元,用于执行所述类别识别模型的训练过程;
36.所述模型训练单元,包括:字典构建单元、分词单元、向量化单元和训练单元;
37.所述字典构建单元,用于根据预先定义的不同事件类别,构建相应的分词字典,其
中,所述事件类别包括数据库性能、数据库状态、数据库可用性和数据库容量,所述分词字典记录各所述事件类别对应的特征分词;
38.所述分词单元,用于通过分词器调用所述分词字典,对各历史故障事件单进行分词处理,从而确定各所述历史故障事件单的特征分词;
39.所述向量化单元,用于分别根据各所述历史故障事件单的特征分词,对各所述历史故障事件单分别进行文本向量化,从而获得各所述历史故障事件单的向量特征;
40.所述训练单元,用于将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型。
41.第三方面,一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的数据库告警抑制方法。
42.第四方面,一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述任一项所述的数据库告警抑制方法。
43.借由上述技术方案,本发明提供的数据库告警抑制方法及相关装置,可以通过获得当前的故障事件单;通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。由此可以看出,本发明将按照故障事件单的不同事件类别,通过预先建立的告警压制规则发送相应的告警信息,一定程度上可以减少告警信息,避免形成告警风暴,进而提高处置告警的实效性。
44.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
45.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
46.图1示出了本发明提供的一种数据库告警抑制方法的流程图;
47.图2示出了本发明提供的一种数据库告警抑制装置的结构示意图;
48.图3示出了本发明提供的一种电子设备的结构示意图。
具体实施方式
49.随着银行业务的高速发展,各种业务场景快速迭代。新兴技术在促进业务发展的同时又极大地增加了it系统的复杂度。为了应对高压力高并发,应用系统数据库机器的数量不断增加,相应的各种数据库故障应急处置面临着越来越大的压力。而故障发现最有效的手段是通过告警,由于机器数量众多,并且关系错综复杂,一个故障会导致多个告警。在重大故障发生时,触发大量告警形成风暴,在运维人员有限的情况下,大量的告警得不到及
时处理。因此,本发明人认为对告警进行压缩或者归并能降低告警数量,可以提高告警的有效性。但现有的告警压缩技术仍然难以满足企业级的故障发现需求,尤其是需要挖掘或者配置大量的告警压缩规则,效率低下且可维护性差导致监控告警数量不可避免地随之增加。
50.当下大多告警系统依靠预先在系统中设置阈值或运维人员亲自查看各项指标数据的方式进行监控,设置的静态阈值通常靠经验得来,存在一定的主观因素。过高的告警阈值,容易漏掉系统运行故障,形成告警漏报。运维团队为了不遗漏告警,不得不提高告警的灵敏度,又带来了大量无效告警,也就是告警误报。告警误报不能及时准确地反映事件对业务的影响范围,系统管理员也无法准确判断故障。同时一个指标的变化,可能引发一连串告警连锁反应。无效告警淹没了有效告警,系统管理人员疲于应对,很难从海量的告警中迅速做出响应,降低运维效率。
51.现有告警关联的方法是基于规则推理的告警关联,在这种方法中,领域内的普通知识表示成一组规则,而与特殊情形相关的知识则由事实组成。一个基于规则的系统由三部分组成:工作存储区、知识库和推理引擎。基于规则的系统的推理机制是一个识别“动作”的循环过程:匹配满足当前状态的所有规则构成冲突集;选择冲突集中最优匹配的规则;执行规则。这样一个过程重复执行直到没有匹配的规则。
52.维持,本发明提供了一种基于场景的开放系统数据库告警关联分析方法,将基于场景和规则的关联分析与基于数据挖掘的fpgrowth(关联规则算法)算法相结合,通过准确的关联分析,抑制告警风暴,降低告警数量,进而提升运维人员分析排障的应急效率。
53.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
54.如图1所示,本发明提供了一种数据库告警抑制方法,包括:s100、s200和s300;
55.s100、获得当前的故障事件单;
56.可选的,在数据库系统的运行过程中,可能会发生一些故障,需要运维人员进行及时处理。针对这些故障,会产生对应的故障事件单和告警。因为,本方可以获得当前产生的新的故障事件单,即本文所说的当前的故障事件单,本发明对此不做限制。
57.可选的,故障事件单是本领域的公知概念,故障事件单中记录了相应故障的故障信息,本发明对此不走过多描述。
58.s200、通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别;
59.其中,一个所述故障事件单对应一个所述事件类别;
60.可选的,本发明可以预先定义多种事件类别,并根据定义的事件类别建立类别识别模型,以便于后续将不同故障事件单划分至相应的事件类别。例如,结合图1所示的实施方式,在某些可选的实施方式中,所述类别识别模型的训练过程,包括:步骤1.1、步骤1.2、步骤1.3和步骤1.4;
61.步骤1.1、根据预先定义的不同事件类别,构建相应的分词字典,其中,所述事件类别包括数据库性能、数据库状态、数据库可用性和数据库容量,所述分词字典记录各所述事件类别对应的特征分词;
62.可选的,本发明可以为不同的事件类别设置对应的多个特征分词,包括数据库的专业名词和默认字典中的一些名词。对于特征分词,本发明可以根据实际需要进行选择和设置,本发明对此不做限制。
63.步骤1.2、通过分词器调用所述分词字典,对各历史故障事件单进行分词处理,从而确定各所述历史故障事件单的特征分词;
64.可选的,本发明可以通过nlp分词器调用分词字典对故障事件单进行分词处理。nlp分词器属于本领域的公知概念,本发明对此不做过多描述。分词处理指的是将故障事件单中记载信息拆分成多个独立的单词(包括中文单词和英文单词),然后将拆分得到的单词与分词字典中的特征分词进行对比匹配,从而确定故障事件中涉及的特征分词。
65.需要说明的是:nlp分词器采用业界较常用的开源jieba分词器。jieba能够实现包括分词、词性标注以及命名实体识别等多种功能。支持精准模式、全模式、搜索模式分词,且支持自定义词典。针对要分词的故障事件单,首先要导入jieba词库,再进行数据清洗,根据jieba词库的停用词表去除原始数据中的停用词以及各种符号。之后对句子使用jieba进行分词,并且将分好的词之间使用空格连接。分词和去除停用词后,需要进行特征提取。特征提取采用jieba基于词频选择特征结合权重tf-idf算法。tf-idf算法是一种用于信息检索与数据挖掘的常用加权技术。当有tf(词频)和idf(逆文档频率)后,将这两个词相乘,就能得到一个词的tf-idf的值,将值由大到小排序,排在最前面的几个词,就是特征分词,也就得到了故障事件类别对应的特征分词。
66.可选的,历史故障事件单指的是之前已经生成的故障事件单,本发明对此不做限制。
67.步骤1.3、分别根据各所述历史故障事件单的特征分词,对各所述历史故障事件单分别进行文本向量化,从而获得各所述历史故障事件单的向量特征;
68.可选的,为了提高本发明的分类模型的准确度,本发明不采用直接使用特征分词进行训练的方式。而是按照历史故障事件单中各个特征分词的分布情况,对历史故障事件单进行文本向量化,以便于后续使用向量特征对分类模型进行训练。
69.可选的,文本向量化属于本领域的公知技术,本发明对此不做过多描述。例如,将历史故障事件单中特征分词设置为“1”,其它不是特征分词的单词均设置为“0”,从而实现对历史故障事件单进行过文本向量化。其中,由“0”和“1”构成的字符串即为该历史故障事件单的向量特征,本发明对此不做过多描述。
70.步骤1.4、将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型。
71.可选的,本发明对于分类模型的选择和训练过程不做限制。例如,结合上一个实施方式,在某些可选的实施方式中,所述步骤1.4,包括:
72.调用svm分类器,并将各所述历史故障事件单的向量特征输入至所述svm分类器进行训练,从而得到所述分类模型。
73.可选的,svm分类器属于本领域的公知技术,本发明对此不做过多描述。需要说明的是:调用一个开源的svm分类器libsvm中的svm-train来训练模型,libsvm是一个简单、易于使用和快速有效的svm模式识别与回归的开源软件包。
74.s300、根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相
应的告警信息;
75.其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。
76.可选的,如前所述,针对任何一个故障事件单,本发明可以确认其所属的事件类别,并根据事件类别发送相应的告警信息,一定程度上可以减少告警信息的数量,本发明对此不做限制。
77.可选的,本发明对于告警压制规则和建立告警压制规则的过程不做限制,任何可行的方式均属于本发明的保护范围。例如,结合图1所示的实施方式,在某些可选的实施方式中,所述告警压制规则的建立过程,包括:步骤2.1、步骤2.2、步骤2.3、步骤2.4、步骤2.5、步骤2.6和步骤2.7;
78.步骤2.1、从故障事件单库中获取各所述历史故障事件单;
79.步骤2.2、通过所述类别识别模型,确定各所述历史故障事件单对应的事件类别,并从各所述历史故障事件单中分别抽取相应的细类关键字、故障开始时间和故障恢复时间;
80.可选的,如前所述,训练好的类别识别模型可以识别历史故障事件单的事件类别,以便于后续根据事件类别将故障事件单和历史告警信息关联,本发明对此不做限制。
81.可选的,如前所述,故障事件单中记录故障的各种故障信息,其中就包括细类关键字、故障开始时间和故障恢复时间等。其中,细类关键字是对事件类型更进一步细致的划分,故障开始时间和故障恢复时间均是本领域的公知概念。当然,本发明还可以抽取其他故障信息,例如故障事件单编码、告警时间、告警位置、告警指标和告警描述等,本发明对此不做限制。
82.步骤2.3、从告警库中获取针对各所述历史故障事件单发送的历史告警信息,其中,一个所述历史故障事件单对应至少一条所述历史告警信息;
83.步骤2.4、从各所述历史告警信息中分别提取相应的事件类别、细类关键字、故障开始时间和故障恢复时间;
84.可选的,告警信息中也记录了对应故障的各种故障信息,与相应故障的故障事件单对应。为了后续可以将历史告警信息和历史故障事件单进行关联,所以本发明可从历史告警信息中提取相应的事件类别、细类关键字、故障开始时间和故障恢复时间。
85.可选的,本发明的步骤2.1和步骤2.3之间没有必然的先后执行顺序,可以先执行步骤2.1,也可以先执行步骤2.3,还可以并行执行步骤2.1和步骤2.3,本发明对此不做限制。
86.步骤2.5、根据各所述历史故障事件单的事件类别、细类关键字、故障开始时间和故障恢复时间,以及各所述历史告警信息的事件类别、细类关键字、故障开始时间和故障恢复时间,分别将各所述历史故障事件单与对应的历史告警信息进行关联,其中,一条所述历史告警信息关联一个所述历史故障事件单,一个所述历史故障事件单关联至少一条所述历史告警信息;
87.可选的,如前所述,针对一个历史故障事件单,可以产生多个告警信息。所以相互关联的历史故障事件单和历史告警信息的事件类别和细类关键字应一致,且历史告警信息的故障开始时间和故障恢复时间含于历史故障事件单的时间范围内(历史故障事件单的故障开始时间至故障恢复时间的范围内)。
88.可选的,通过将历史故障事件单和历史告警信息进行关联,从而确定告警信息与故障事件单之间的对应关系,有利于进行后续的数据挖掘,确定告警压制规则,本发明对此不做限制。
89.步骤2.6、将各所述历史故障事件单和相关联的各历史告警信息,按不同事件类别分组输入至数据挖掘算法fp-growth,从而获得所述fp-growth的数据挖掘结果,其中,相同事件类别的历史故障事件单和相关联的历史告警信息划分为同一组,所述数据挖掘结果反映各所述历史告警信息与相应事件类别的关联度;
90.可选的,数据挖掘算法fp-growth属于本领域公知概念,本发明对此不做过多描述,具体请参见本领域的相关说明。
91.可选的,在将历史告警信息输入至数据挖掘算法fp-growth,本发明可以先对各个历史故障事件单关联的历史告警信息进行数据清洗。例如,本发明可以去除主动维护告警,主动维护告警对数据挖掘来说属于噪声数据,需要过滤掉,根据告警信息有无系统维护标志判断,系统维护标志是由系统运维人员提前手工设置的一段系统维护时间,在此期间会发生因系统维护产生的大量告警,此类告警属于预期范围内的信息,不应被关联到故障事件单,属于干扰数据,需要去除。本发明还可以剔除重复告警数据,即,对应同一个故障事件单编码,在故障发生期间的告警指标与告警位置相同告警保留一条即可,此处的故障事件单编码是指唯一标识一条故障事件单的编码。本发明还可以去除关键字段缺失告警,一般情况下,事务数据库中包含多个事务,每个故障事件单编码对应的告警集合被视为一个事务(对历史告警按事件类别、故障事件单编码、细类关键字、故障恢复时间进行关联),每个故障事件单相关的告警,被视为项目。因此事务数据库包含多个事务,每个事务包含多个项目,经过历史告警离散和去噪操作后的告警即为事务数据库中的项目。
92.步骤2.7、根据各所述历史告警信息与相应事件类别的关联度,建立所述告警压制规则。
93.可选的,本发明对于根据关联度建立告警压制规则的过程不做限制,任何可行的方式均属于本发明的保护范围。例如,结合上一个实施方式,在某些可选的实施方式中,所述步骤2.7,包括:步骤3.1和步骤3.2;
94.步骤3.1、针对任一所述事件类别,均执行:将相应的各历史告警信息按照相应关联度的大小,依次排列;
95.可选的,关联度反应的历史告警信息与相应历史故障事件单的事件类别的关联程度。关联度越高,则说明针对该事件类型的故障事件单可以发送相应关联度高的告警信息。
96.步骤3.2、将关联度大于关联度阈值的历史告警信息设置为相应事件类别的可发送信息;
97.可选的,本发明可以根据实际需要设定和变更关联度阈值。
98.结合上一个实施方式,在某些可选的实施方式中,在所述s300之后,所述方法还包括:根据所述告警压制规则当前对告警信息的压制情况,调整所述关联度阈值。
99.例如,将关联度阈值设置为80%,则说明告警压制规则中设置将关联度高于80%的历史告警信息设置为相应事件类别的可发送信息。当有新的故障事件单产生时,则发送相应事件类别的、关联度高于80%的历史告警信息即可,不限制可发送消息的数量,但一定程度上减少了告警信息。
100.当然,本发明也可以将关联度较高的前n个历史告警信息设置为相应事件类别的可发送信息,n为大于1的整数,本发明对此不做限制。
101.所述s300,包括:根据所述事件类别,确定相应的可发送信息并发送。
102.如图2所示,本发明提供了一种数据库告警抑制装置,包括:当前事件单获得单元100、事件类别识别单元200和告警压制单元300;
103.所述当前事件单获得单元100、用于获得当前的故障事件单;
104.所述事件类别识别单元200,用于通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;
105.所述告警压制单元300,用于根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。
106.结合图2所示的实施方式,在某些可选的实施方式中,所述装置还包括模型训练单元;
107.所述模型训练单元,用于执行所述类别识别模型的训练过程;
108.所述模型训练单元,包括:字典构建单元、分词单元、向量化单元和训练单元;
109.字典构建单元,用于根据预先定义的不同事件类别,构建相应的分词字典,其中,所述事件类别包括数据库性能、数据库状态、数据库可用性和数据库容量,所述分词字典记录各所述事件类别对应的特征分词;
110.分词单元,用于通过分词器调用所述分词字典,对各历史故障事件单进行分词处理,从而确定各所述历史故障事件单的特征分词;
111.向量化单元,用于分别根据各所述历史故障事件单的特征分词,对各所述历史故障事件单分别进行文本向量化,从而获得各所述历史故障事件单的向量特征;
112.训练单元,用于将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型。
113.结合上一个实施方式,在某些可选的实施方式中,所述训练单元,包括:训练子单元;
114.训练子单元,用于调用svm分类器,并将各所述历史故障事件单的向量特征输入至所述svm分类器进行训练,从而得到所述分类模型。
115.结合图2所示的实施方式,在某些可选的实施方式中,所述装置还包括规则建立单元;
116.所述规则建立单元,用于执行所述告警压制规则的建立过程;
117.所述规则建立单元,包括:历史事件单获得单元、第一信息确定单元、历史告警获得单元、第二信息确定单元、关联单元、挖掘单元和规则单元;
118.历史事件单获得单元,用于从故障事件单库中获取各所述历史故障事件单;
119.第一信息确定单元,用于通过所述类别识别模型,确定各所述历史故障事件单对应的事件类别,并从各所述历史故障事件单中分别抽取相应的细类关键字、故障开始时间和故障恢复时间;
120.历史告警获得单元,用于从告警库中获取针对各所述历史故障事件单发送的历史告警信息,其中,一个所述历史故障事件单对应至少一条所述历史告警信息;
121.第二信息确定单元,用于从各所述历史告警信息中分别提取相应的事件类别、细类关键字、故障开始时间和故障恢复时间;
122.关联单元,用于根据各所述历史故障事件单的事件类别、细类关键字、故障开始时间和故障恢复时间,以及各所述历史告警信息的事件类别、细类关键字、故障开始时间和故障恢复时间,分别将各所述历史故障事件单与对应的历史告警信息进行关联,其中,一条所述历史告警信息关联一个所述历史故障事件单,一个所述历史故障事件单关联至少一条所述历史告警信息;
123.挖掘单元,用于将各所述历史故障事件单和相关联的各历史告警信息,按不同事件类别分组输入至数据挖掘算法fp-growth,从而获得所述fp-growth的数据挖掘结果,其中,相同事件类别的历史故障事件单和相关联的历史告警信息划分为同一组,所述数据挖掘结果反映各所述历史告警信息与相应事件类别的关联度;
124.规则单元,用于根据各所述历史告警信息与相应事件类别的关联度,建立所述告警压制规则。
125.结合上一个实施方式,在某些可选的实施方式中,所述规则单元,包括:排序单元和设置单元;
126.排序单元,用于针对任一所述事件类别,均执行:将相应的各历史告警信息按照相应关联度的大小,依次排列;
127.设置单元,用于将关联度大于关联度阈值的历史告警信息设置为相应事件类别的可发送信息;
128.所述告警压制单元300,包括:告警压制子单元;
129.告警压制子单元,用于根据所述事件类别,确定相应的可发送信息并发送。
130.结合上一个实施方式,在某些可选的实施方式中,所述装置还包括:阈值调整单元;
131.阈值调整单元,用于在所述根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息之后,根据所述告警压制规则当前对告警信息的压制情况,调整所述关联度阈值。
132.本发明提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的数据库告警抑制方法。
133.如图3所示,本发明提供了一种电子设备70,所述电子设备70包括至少一个处理器701、以及与所述处理器701连接的至少一个存储器702、总线703;其中,所述处理器701、所述存储器702通过所述总线703完成相互间的通信;所述处理器701用于调用所述存储器702中的程序指令,以执行上述任一项所述的数据库告警抑制方法。
134.在本技术中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
135.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
136.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
137.以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

技术特征:
1.一种数据库告警抑制方法,其特征在于,包括:获得当前的故障事件单;通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。2.根据权利要求1所述的方法,其特征在于,所述类别识别模型的训练过程,包括:根据预先定义的不同事件类别,构建相应的分词字典,其中,所述事件类别包括数据库性能、数据库状态、数据库可用性和数据库容量,所述分词字典记录各所述事件类别对应的特征分词;通过分词器调用所述分词字典,对各历史故障事件单进行分词处理,从而确定各所述历史故障事件单的特征分词;分别根据各所述历史故障事件单的特征分词,对各所述历史故障事件单分别进行文本向量化,从而获得各所述历史故障事件单的向量特征;将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型。3.根据权利要求2所述的方法,其特征在于,所述将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型,包括:调用svm分类器,并将各所述历史故障事件单的向量特征输入至所述svm分类器进行训练,从而得到所述分类模型。4.根据权利要求1所述的方法,其特征在于,所述告警压制规则的建立过程,包括:从故障事件单库中获取各所述历史故障事件单;通过所述类别识别模型,确定各所述历史故障事件单对应的事件类别,并从各所述历史故障事件单中分别抽取相应的细类关键字、故障开始时间和故障恢复时间;从告警库中获取针对各所述历史故障事件单发送的历史告警信息,其中,一个所述历史故障事件单对应至少一条所述历史告警信息;从各所述历史告警信息中分别提取相应的事件类别、细类关键字、故障开始时间和故障恢复时间;根据各所述历史故障事件单的事件类别、细类关键字、故障开始时间和故障恢复时间,以及各所述历史告警信息的事件类别、细类关键字、故障开始时间和故障恢复时间,分别将各所述历史故障事件单与对应的历史告警信息进行关联,其中,一条所述历史告警信息关联一个所述历史故障事件单,一个所述历史故障事件单关联至少一条所述历史告警信息;将各所述历史故障事件单和相关联的各历史告警信息,按不同事件类别分组输入至数据挖掘算法fp-growth,从而获得所述fp-growth的数据挖掘结果,其中,相同事件类别的历史故障事件单和相关联的历史告警信息划分为同一组,所述数据挖掘结果反映各所述历史告警信息与相应事件类别的关联度;根据各所述历史告警信息与相应事件类别的关联度,建立所述告警压制规则。5.根据权利要求4所述的方法,其特征在于,所述根据各所述历史告警信息与相应事件类别的关联度,建立所述告警压制规则,包括:
针对任一所述事件类别,均执行:将相应的各历史告警信息按照相应关联度的大小,依次排列;将关联度大于关联度阈值的历史告警信息设置为相应事件类别的可发送信息;所述根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,包括:根据所述事件类别,确定相应的可发送信息并发送。6.根据权利要求5所述的方法,其特征在于,在所述根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息之后,所述方法还包括:根据所述告警压制规则当前对告警信息的压制情况,调整所述关联度阈值。7.一种数据库告警抑制装置,其特征在于,包括:当前事件单获得单元、事件类别识别单元和告警压制单元;所述当前事件单获得单元、用于获得当前的故障事件单;所述事件类别识别单元,用于通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;所述告警压制单元,用于根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。8.根据权利要求7所述的装置,其特征在于,所述装置还包括模型训练单元;所述模型训练单元,用于执行所述类别识别模型的训练过程;所述模型训练单元,包括:字典构建单元、分词单元、向量化单元和训练单元;所述字典构建单元,用于根据预先定义的不同事件类别,构建相应的分词字典,其中,所述事件类别包括数据库性能、数据库状态、数据库可用性和数据库容量,所述分词字典记录各所述事件类别对应的特征分词;所述分词单元,用于通过分词器调用所述分词字典,对各历史故障事件单进行分词处理,从而确定各所述历史故障事件单的特征分词;所述向量化单元,用于分别根据各所述历史故障事件单的特征分词,对各所述历史故障事件单分别进行文本向量化,从而获得各所述历史故障事件单的向量特征;所述训练单元,用于将各所述历史故障事件单的向量特征输入至待训练的模型进行训练,从而训练得到所述分类模型。9.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1至6中任一项所述的数据库告警抑制方法。10.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至6中任一项所述的数据库告警抑制方法。

技术总结
本发明公开了数据库告警抑制方法及相关装置,可以通过获得当前的故障事件单;通过预先建立的类别识别模型,确定所述故障事件单对应的事件类别,其中,一个所述故障事件单对应一个所述事件类别;根据所述事件类别和预先通过数据挖掘算法建立的告警压制规则,发送相应的告警信息,其中,所述告警压制规则记录不同的所述事件类别与所述告警信息的对应关系。由此可以看出,本发明将按照故障事件单的不同事件类别,通过预先建立的告警压制规则发送相应的告警信息,一定程度上可以减少告警信息,避免形成告警风暴,进而提高处置告警的实效性。进而提高处置告警的实效性。进而提高处置告警的实效性。


技术研发人员:韩久学 韩广乐 周进 张明
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:2022.03.23
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-2771.html

最新回复(0)