一种星载模型部署方法、装置、存储介质及电子设备与流程

allin2025-07-18  225


本说明书涉及计算机,尤其涉及一种星载模型部署方法、装置、存储介质及电子设备。


背景技术:

1、近年来,卫星技术迅猛发展,卫星应用领域不断增加、功能不断丰富,卫星应用融入到人们的日常生活。由于卫星载荷发射成本高,携带载荷的计算能力有限,卫星的智能化水平有待提升。同时,随着人工智能技术的发展,以生成式人工智能为代表的大模型在各个领域展现出优异的效果,被应用于各个领域,将大模型部署在卫星上,有助于提升卫星的智能化水平。

2、但是,一方面,大模型通常包含百亿或千亿的参数,存储空间达到数十乃至数百gb,运行大模型对算力资源要求很高,卫星有限的计算资源很难直接部署和应用大模型。另一方面,卫星和地面的通信窗口时间非常短,往往只有几分钟或者几十分钟,无法长时间连接,同时,星地之间数据传输通信带宽也有限,很难在短时间内将大模型传输到卫星上。

3、因此,如何简单高效地部署拥有大模型同等性能的星载模型是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种星载模型部署方法、装置、存储介质及电子设备,以至少部分地解决现有技术存在的上述问题。

2、本说明书采用下述技术方案:

3、本说明书提供了一种星载模型部署方法,包括:

4、获取预先训练的基座大模型和星载基座模型,并将所述星载基座模型传输给目标卫星;

5、确定待部署的目标星载模型所面向的目标任务领域;

6、针对所述目标任务领域训练所述基座大模型,得到面向所述目标任务领域的专家大模型;

7、根据所述专家大模型训练所述星载基座模型,得到面向所述目标任务领域的增量微调模型;

8、将所述增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述增量微调模型进行融合,得到目标星载模型。

9、可选地,所述基座大模型和所述星载基座模型为面向通用领域的模型,所述基座大模型包含的参数量大于所述星载基座模型。

10、可选地,针对所述任务领域训练所述基座大模型,具体包括:

11、获取针对所述任务领域的训练样本和训练标注;

12、将所述训练样本输入所述基座大模型,得到所述基座大模型输出的待优化输出结果;

13、根据所述待优化输出结果与所述训练标注之间的差异,对所述基座大模型的参数进行调整。

14、可选地,根据所述专家大模型训练所述星载基座模型,具体包括:

15、通过知识蒸馏将所述专家大模型的知识传递给所述星载基座模型。

16、可选地,所述方法还包括:

17、针对所述目标星载模型中包含的每个参数,将该参数的小数位数量化为指定位数,得到轻量化的目标星载模型。

18、可选地,所述方法还包括:

19、响应于所述目标卫星需要更新所述目标星载模型,针对所述目标任务领域重新训练所述基座大模型,得到面向所述目标任务领域的更新专家大模型;

20、根据所述更新专家大模型训练所述星载基座模型,得到面向所述目标任务领域的更新增量微调模型;

21、将所述更新增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述更新增量微调模型进行融合,得到更新星载模型。

22、可选地,在得到更新星载模型之后,所述方法包括:

23、所述目标卫星测试所述更新星载模型是否能够正常运行;

24、响应于所述更新星载模型能够正常运行,所述目标卫星采用所述更新星载模型替代所述目标星载模型;

25、响应于所述更新星载模型不能正常运行,所述目标卫星返回错误提示。

26、本说明书提供的一种星载模型部署装置,所述装置包括:

27、获取模块,用于获取预先训练的基座大模型和星载基座模型,并将所述星载基座模型传输给目标卫星;

28、确定模块,用于确定待部署的目标星载模型所面向的目标任务领域;

29、训练模块,用于针对所述目标任务领域训练所述基座大模型,得到面向所述目标任务领域的专家大模型;

30、微调模块,用于根据所述专家大模型训练所述星载基座模型,得到面向所述目标任务领域的增量微调模型;

31、传输模块,用于将所述增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述增量微调模型进行融合,得到目标星载模型。

32、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述星载模型部署方法。

33、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述星载模型部署方法。

34、本说明书采用的上述至少一个技术方案能够达到以下有益效果:

35、在本说明书提供的星载模型部署方法中,获取预先训练的基座大模型和星载基座模型,并将所述星载基座模型传输给目标卫星;确定待部署的目标星载模型所面向的目标任务领域;针对所述目标任务领域训练所述基座大模型,得到面向所述目标任务领域的专家大模型;根据所述专家大模型训练所述星载基座模型,得到面向所述目标任务领域的增量微调模型;将所述增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述增量微调模型进行融合,得到目标星载模型。

36、在采用本说明书提供的星载模型部署方法对目标卫星需求的目标星载模型进行部署时,可首先将星载基座模型传输给目标卫星,并确定目标星载模型面向的目标任务领域;随后基于基座大模型训练得到目标任务领域下的专家大模型,并将专家大模型的知识传输给星载基座模型,得到增量微调模型;最终将增量微调模型传输给目标卫星,使目标卫星融合星载基座模型和增量微调模型,得到目标星载模型。通过本方法可在满足卫星的存储资源的条件的情况下,将性能近似于大模型的星载模型部署到卫星上,有效控制星载模型体积的同时,大幅提高星载模型的性能,同时使星载模型的后续更新更加简便。



技术特征:

1.一种星载模型部署方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基座大模型和所述星载基座模型为面向通用领域的模型,所述基座大模型包含的参数量大于所述星载基座模型。

3.如权利要求1所述的方法,其特征在于,针对所述任务领域训练所述基座大模型,具体包括:

4.如权利要求1所述的方法,其特征在于,根据所述专家大模型训练所述星载基座模型,具体包括:

5.如权利要求1所述的方法,其特征在于,所述方法还包括:

6.如权利要求1所述的方法,其特征在于,所述方法还包括:

7.如权利要求6所述的方法,其特征在于,在得到更新星载模型之后,所述方法包括:

8.一种星载模型部署装置,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。

10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。


技术总结
本说明书公开了一种星载模型部署方法、装置、存储介质及电子设备。在本说明书提供的星载模型部署方法中,获取预先训练的基座大模型和星载基座模型,并将所述星载基座模型传输给目标卫星;确定待部署的目标星载模型所面向的目标任务领域;针对所述目标任务领域训练所述基座大模型,得到面向所述目标任务领域的专家大模型;根据所述专家大模型训练所述星载基座模型,得到面向所述目标任务领域的增量微调模型;将所述增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述增量微调模型进行融合,得到目标星载模型。

技术研发人员:王海涛,魏宁,姚柯璐,万志国,李超,陈宏宇
受保护的技术使用者:之江实验室
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-23124.html

最新回复(0)