本发明涉及人工智能,更具体地涉及调度方法和装置以及计算机可读存储介质。
背景技术:
1、随着各类大模型的开源及普及,许多公司甚至产品都会接入结合公司本身特点的大模型。例如,一些公司提供本公司内部人员使用的财务数据分析模型、客户数据分析模型等等,一些产品接入用于介绍本公司详细资料的语音交流机器人等等。这些应用方向存在以下特点:应用场景固定,开源大模型能针对本公司特定的应用场景,使用少量数据进行微调或写好提示(prompt),接入诸如langchain之类的开源框架以满足公司员工的日常使用,然后只需在服务器终端进行输入输出即可。然而,多人直接通过安全外壳协议(ssh)访问服务器并拉取输出显然并不现实,因此存在本地部署一个小型、安全可靠且能实现并发的后台系统的需求。
技术实现思路
1、鉴于以上所述的一个或多个问题,本公开提供了一种调度方法和装置以及计算机可读存储介质。
2、根据本公开的实施例的一方面,提供了一种调度方法,包括:接收来自用户的第一请求,其中,所述第一请求包括指示所述用户所询问的问题的数据;向所述用户发送针对所述第一请求所分配的第一标识和第二标识,其中,所述第一标识指示与所述问题相对应的通用唯一标识符,并且所述第二标识指示针对所述第一请求所分配的处理单元的标识符;将所述第一请求加入到等待队列中;接收来自所述用户的第二请求,其中,所述第二请求包括所述第一标识和所述第二标识;以及向所述用户发送响应消息,其中,所述响应消息包括针对所述问题的答案。
3、根据本公开的实施例的一方面,提供了一种调度装置,包括:接收模块:用于接收来自用户的第一请求,其中,所述第一请求包括指示所述用户所询问的问题的数据;发送模块:用于向所述用户发送针对所述第一请求所分配的第一标识和第二标识,其中,所述第一标识指示与所述问题相对应的通用唯一标识符,并且所述第二标识指示针对所述第一请求所分配的处理单元的标识符;处理模块:用于将所述第一请求加入到等待队列中;其中,所述接收模块还用于:接收来自所述用户的第二请求,其中,所述第二请求包括所述第一标识和所述第二标识;并且所述发送模块还用于:向所述用户发送响应消息,其中,所述响应消息包括针对所述问题的答案。
4、根据本公开的实施例的一方面,提供了一种存储有代码的计算机可读存储介质,所述代码在由处理电路执行时使得所述处理电路实现如上所述的方法。
5、根据本公开的实施例的调度方法和装置以及计算机可读存储介质采取本地部署的方式,只需进行简单的本地服务器部署即可,而不需要购买在线服务器或云服务系统,但仍能够实现云效果且成本更低,这样既可以控制成本也能满足使用需求。此外,采用本地部署服务器的方式能够避免数据外泄,在保证安全性的同时能满足多用户同时访问服务器大模型的需求。
1.一种调度方法,包括:
2.根据权利要求1所述的方法,其中,所述第一请求包括超文本传输协议请求中的post请求,并且所述第二请求包括超文本传输协议请求中的get请求。
3.根据权利要求1所述的方法,其中,在接收来自所述用户的第二请求之后,所述方法进一步包括:
4.根据权利要求3所述的方法,所述方法进一步包括:
5.根据权利要求3所述的方法,所述方法进一步包括:
6.根据权利要求5所述的方法,所述方法进一步包括:
7.根据权利要求6所述的方法,其中,所述等待队列中的每个请求的优先级基于该请求加入到所述等待队列中的时间来确定。
8.根据权利要求5或6所述的方法,其中,处理所述工作队列中的所有请求包括:
9.根据权利要求8所述的方法,所述方法进一步包括:
10.根据权利要求1所述的方法,所述方法进一步包括:
11.根据权利要求10所述的方法,所述方法进一步包括:
12.根据权利要求11所述的方法,所述方法进一步包括:
13.根据权利要求1所述的方法,所述方法进一步包括:
14.一种存储有代码的计算机可读存储介质,所述代码在由处理电路执行时使得所述处理电路实现如权利要求1到13中任一项所述的方法。