一种超级计算机节点负载查询方法及装置

allin2025-03-15  43


本发明涉及超级计算机的信息查询,尤其涉及一种超级计算机节点负载查询方法及装置。


背景技术:

1、超级计算机具有极大的数据存储容量和极高的数据处理速度,是现代科技创新必不可少的重要基础设施,无论是实验科学、理论科学、计算科学还是数据科学,超级计算机因其强大的数据处理能力而有着广泛的应用。为了最大化利用超级计算机,往往会利用它同步处理多个应用作业,在常规情况下有上万个应用作业同时运行。在多个应用作业同时运行情况下,实时掌握超级计算机上作业的运行情况意义重大,这样不仅可帮助用户及时发现运行异常的作业,及时处理异常作业,从而户节省时间和费用,而且还可以避免计算资源的浪费。作为用户来说,及时了解作业的运行情况,才能对运行不正常的作业及时进行处理,避免浪费不必要的时间和金钱。

2、现有技术中,一般是通过查询运行作业的负载情况来确定作业是否正常运行,即负载为0,则表示作业根本没有运行,而负载太大,则表示作业没有正常并行。目前一般是利用bjobs命令来查询作业运行状态以及利用lsload命令查询节点负载,但是bjobs命令无法准确反映作业运行状态,经常出现误报的情况,而lsload命令则只能显示所有节点的负载情况,无法精确定位需要查询的作业对应的节点负载情况,导致现有查询超级计算机中节点负载的方法需要耗费大量的时间和精力,无法实时确定用户想查询作业对应的节点负载情况。

3、因此,现有技术还有待于改进和发展。


技术实现思路

1、鉴于上述现有技术的不足,本发明的目的在于提供一种超级计算机节点负载查询方法及装置,旨在解决现有技术中查询超级计算机中特定节点负载的方法需要耗费大量时间和精力,却无法实时确定特定节点的负载情况的问题。

2、本发明第一方面提供了一种超级计算机节点负载查询方法,所述方法包括:

3、获取节点负载查询指令;

4、基于所述节点负载查询指令,获取查询参数;

5、基于所述查询参数,获取运行节点名称列表;

6、基于所述运行节点名称列表,获取并输出运行节点的负载状态。

7、在一种实施方式中,基于所述节点负载查询指令,获取查询参数之前,包括:

8、确定所述节点负载查询指令内是否包括查询参数,所述查询参数包括待查询运行作业数量、待查询运行作业号和待查询运行作业顺序;

9、当所述节点负载查询指令内不包括所述查询参数时,停止查询并输出查询失败信息。

10、在一种实施方式中,当所述节点负载查询指令内包括所述查询参数时,基于所述节点负载查询指令,获取查询参数,具体包括:

11、确定所述节点负载查询指令是否为全局作业查询指令;

12、当所述节点负载查询指令不是所述全局作业查询指令时,提取所述节点负载查询指令中的分隔符;

13、基于所述分隔符,获取所述节点负载查询指令中的所述待查询运行作业数量、所述待查询运行作业号和所述待查询运行作业顺序作为所述查询参数。

14、在一种实施方式中,基于所述查询参数,获取运行节点名称列表,具体包括:

15、基于所述待查询运行作业号,获取各所述待查询运行作业号对应的运行节点名称;

16、基于所述待查询运行作业顺序排列所述运行节点名称,并以所述分隔符分隔所述运行节点名称,获取所述运行节点名称列表。

17、在一种实施方式中,基于所述运行节点名称列表,获取并输出运行节点的负载状态,具体包括:

18、确定所述运行节点名称列表是否为空;

19、当所述运行节点名称列表不为空时,基于所述运行节点名称列表内的运行节点名称,获取各运行节点的负载状态;

20、按照所述运行节点名称列表中的顺序,输出各所述运行节点的负载状态。

21、在一种实施方式中,当所述运行节点名称列表为空时,停止查询并输出查询失败信息。

22、在一种实施方式中,当所述节点负载查询指令为全局作业查询指令时,获取当前运行作业数量作为所述待查询运行作业数量,获取所有运行作业号作为所述待查询运行作业号,获取当前运行作业顺序作为所述待查询运行作业顺序。

23、在一种实施方式中,基于所述查询参数,获取运行节点名称列表,具体包括:

24、基于所述所有运行作业号,获取各运行作业号对应的运行节点名称;

25、基于所述当前运行作业顺序排列所述运行节点名称,获取所述运行节点名称列表。

26、在一种实施方式中,基于所述运行节点名称列表,获取并输出运行节点的负载状态,具体包括:

27、基于所述运行节点名称内的运行节点名称,获取各运行节点的负载状态;

28、按照所述运行节点名称列表中的顺序,输出各所述运行节点的负载状态。

29、本发明第二方面提供了一种超级计算机节点负载查询装置,包括:

30、指令获取模块,所述指令获取模块用于获取节点负载查询指令;

31、参数获取模块,所述参数获取模块从所述指令获取模块接收所述节点负载查询指令,并基于所述节点负载查询指令获取查询参数;

32、节点名称获取模块,所述节点名称获取模块从所述参数获取模块接收所述查询参数,并基于所述查询参数,获取运行节点名称列表;以及

33、负载查询模块,所述负载查询模块从所述节点名称获取模块接收所述运行节点名称列表,并基于所述运行节点名称列表,获取并输出运行节点的负载状态。

34、本发明公开了一种超级计算机节点负载查询方法及装置,所述方法包括步骤:获取节点负载查询指令;基于所述节点负载查询指令,获取查询参数;基于所述查询参数,获取运行节点名称列表;以及基于所述运行节点名称列表,获取并输出运行节点的负载状态。本发明通过提取查询指令中的查询参数,确定对应待查询作业的节点名称,从而获取待查询作业对应运行节点的负载状态,以确定待查询作业的运行情况。



技术特征:

1.一种超级计算机节点负载查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的超级计算机节点负载查询方法,其特征在于,基于所述节点负载查询指令,获取查询参数之前,包括:

3.根据权利要求2所述的超级计算机节点负载查询方法,其特征在于,当所述节点负载查询指令内包括所述查询参数时,基于所述节点负载查询指令,获取查询参数,具体包括:

4.根据权利要求3所述的超级计算机节点负载查询方法,其特征在于,基于所述查询参数,获取运行节点名称列表,具体包括:

5.根据权利要求4所述的超级计算机节点负载查询方法,其特征在于,基于所述运行节点名称列表,获取并输出运行节点的负载状态,具体包括:

6.根据权利要求5所述的超级计算机节点负载查询方法,其特征在于,当所述运行节点名称列表为空时,停止查询并输出查询失败信息。

7.根据权利要求3所述的超级计算机节点负载查询方法,其特征在于,当所述节点负载查询指令为全局作业查询指令时,获取当前运行作业数量作为所述待查询运行作业数量,获取所有运行作业号作为所述待查询运行作业号,获取当前运行作业顺序作为所述待查询运行作业顺序。

8.根据权利要求7所述的超级计算机节点负载查询方法,其特征在于,基于所述查询参数,获取运行节点名称列表,具体包括:

9.根据权利要求8所述的超级计算机节点负载查询方法,其特征在于,基于所述运行节点名称列表,获取并输出运行节点的负载状态,具体包括:

10.一种超级计算机节点负载查询装置,其特征在于,包括:


技术总结
本发明公开了一种超级计算机节点负载查询方法及装置,所述方法包括步骤:获取节点负载查询指令;基于所述节点负载查询指令,获取查询参数;基于所述查询参数,获取运行节点名称列表;以及基于所述运行节点名称列表,获取并输出运行节点的负载状态。本发明通过提取查询指令中的查询参数,确定对应待查询作业的节点名称,从而获取待查询作业对应运行节点的负载状态,以确定待查询作业的运行情况。

技术研发人员:谢作扬
受保护的技术使用者:南方科技大学
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-19213.html

最新回复(0)