规划控制方法及模型训练方法、装置、设备及介质与流程

allin2025-05-19  76


本公开涉及智能汽车,尤其涉及一种规划控制方法及模型训练方法、装置、设备及介质。


背景技术:

1、随着人工智能技术的发展,诸如基于深度学习、强化学习的人工智能技术越来越多的应用于智能驾驶领域,而规划控制就是人工智能技术在智能驾驶领域中的典型应用场景。

2、而随着汽车智能化等级的提升,汽车在控制过程中会面临更多的不确定性场景和强交互场景,现有的规划控制模型难以适应复杂场景,影响用户体验。


技术实现思路

1、为了解决现有技术中现有的规划控制模型难以适应复杂场景的问题,本发明提供了一种规划控制方法及模型训练方法、装置、设备及介质。

2、第一方面,提供一种规划控制模型的训练方法,应用于车载端,训练方法包括:

3、对车辆的场景数据,以及场景数据所对应生成的规划控制数据和实际控制数据进行采集;

4、对规划控制数据和实际控制数据进行比对,得到比对结果;

5、在比对结果满足预设比对条件的情况下,将场景数据和对应的实际控制数据上传至服务端,服务端用于对规划控制模型进行更新,以得到更新后的规划控制模型,规划控制模型用于根据场景数据生成对应的规划控制数据。

6、在一个可选的实施例中,对规划控制数据和实际控制数据进行比对,得到比对结果之前,包括:

7、确定用于比对的规划控制数据和实际控制数据;

8、对规划控制数据和实际控制数据进行比对,得到比对结果包括:

9、对规划控制数据和实际控制数据进行比对,得到规划控制数据和实际控制数据的重复率。

10、在一个可选的实施例中,确定用于比对的规划控制数据和实际控制数据,包括:

11、确定规划控制数据的第一概率分布;

12、将第一概率分布满足第一预设分布条件的规划控制数据和对应的实际控制数据分别确定为用于比对的规划控制数据和实际控制数据;

13、和/或,确定实际控制数据的第二概率分布;

14、将第二概率分布满足第二预设分布条件的实际控制数据和对应的规划控制数据分别确定为用于比对的规划控制数据和实际控制数据。

15、在一个可选的实施例中,训练方法还包括:

16、在未采集到规划控制数据的情况下,将场景数据和对应的实际控制数据上传至服务端。

17、第二方面,提供一种规划控制模型的训练方法,应用于服务端,所述训练方法包括:

18、获取车辆的场景数据和对应的实际控制数据,所述场景数据和所述实际控制数据根据如第一方面任一项所述的规划控制模型的训练方法上传得到;

19、根据所述场景数据和所述实际控制数据对规划控制模型进行更新,以得到更新后的所述规划控制模型,所述规划控制模型用于根据所述场景数据生成对应的规划控制数据。

20、在一个可选的实施例中,根据所述场景数据和所述实际控制数据对规划控制模型进行更新,以得到更新后的所述规划控制模型之前,包括:

21、判断所述场景数据是否为第一次上传;

22、在判断为否的情况下,将所述场景数据和对应的实际控制数据确定为用于更新所述规划控制模型的所述场景数据和所述实际控制数据。

23、和/或,确定所述实际控制数据的第三概率分布;

24、将所述第三概率分布满足第三预设分布条件的实际控制数据和对应的场景数据分别确定为用于更新所述规划控制模型的所述实际控制数据和所述场景数据。

25、第三方面,提供一种规划控制方法,应用于车载端,规划控制方法包括:

26、对车辆的当前场景数据进行采集;

27、将当前场景数据输入至规划控制模型得到当前场景数据对应的当前规划控制数据,规划控制模型根据如第一方面和/或第二方面中任一项的规划控制模型的训练方法训练得到。

28、第四方面,提供一种规划控制模型的训练装置,应用于车载端,训练装置包括:

29、第一采集模块,用于对车辆的场景数据,以及场景数据所对应的规划控制数据和实际控制数据进行采集;

30、第一比对模块,用于对规划控制数据和实际控制数据进行比对,以得到比对结果;

31、第一上传模块,用于在比对结果满足预设比对条件的情况下,将场景数据和对应的实际控制数据上传至服务端,服务端用于对规划控制模型进行更新,以得到更新后的规划控制模型,规划控制模型用于根据场景数据对应的规划控制数据。

32、第五方面,提供一种规划控制模型的训练装置,应用于服务端,训练装置包括:

33、获取模块,用于获取车辆的场景数据和对应的实际控制数据,所述场景数据和所述实际控制数据根据如第四方面中所述的规划控制模型的训练方法上传得到;

34、更新模块,用于根据所述场景数据和所述实际控制数据对规划控制模型进行更新,以得到更新后的所述规划控制模型,所述规划控制模型用于根据所述场景数据生成对应的规划控制数据。

35、第六方面,提供一种规划控制装置,应用于车载端,规划控制装置包括:

36、第二采集模块,用于对车辆的场景数据进行采集;

37、规划控制模块,用于将当前场景数据输入至规划控制模型得到当前场景数据对应的当前规划控制数据,规划控制模型根据如第四方面和/或第五方面任一项的规划控制模型的训练装置训练得到。

38、第七方面,提供一种电子设备,电子设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如第一方面和/或第二方面中任一项的规划控制模型的训练方法,和/或第三方面的规划控制方法。

39、第八方面,提供一种计算机可读存储介质,计算机可读存储介质中存储有至少一条指令或者至少一段程序,至少一条指令或者至少一段程序由处理器加载并执行以实现如第一方面和/或第二方面中任一项的规划控制模型的训练方法,和/或第三方面的规划控制方法。

40、本公开实施例提供的、装置、电子设备及存储介质,具有如下技术效果:

41、一方面,通过规划控制数据和实际控制数据的比对能够对车辆在一些场景下的拟人性进行判断。对于一些复杂场景,智能驾驶系统的拟人性不高,其所得到的规划控制数据那一满足场景需求,因此,可以通过跟对应场景下的场景数据和实际控制数据对规划控制模型进行更新,以提升规划控制模型的智能化程度,进而提升车辆对于复杂场景的适应能力和用户体验感。

42、另外一方面,对于规划控制数据和实际控制数据在车载端完成比对判断操作,仅将比对结果满足预设比对条件的实际控制数据及其用于标识对应场景的场景数据才上传服务端,能够筛除掉大部分不具有学习价值的数据和已满足拟人性需求的数据,简化模型训练前繁琐的数据处理前期流程,减少服务端模型训练的数据处理负担,且由于上传服务端的数据量减少,能够有效避免在数据上传过程中出现的数据宕机或数据丢失的问题,保证系统的稳定性。

43、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。


技术特征:

1.一种规划控制模型的训练方法,其特征在于,应用于车载端,所述训练方法包括:

2.如权利要求1所述的训练方法,其特征在于,对所述规划控制数据和所述实际控制数据进行比对,得到比对结果之前,包括:

3.如权利要求2所述的训练方法,其特征在于,确定用于比对的规划控制数据和实际控制数据,包括:

4.如权利要求1所述的训练方法,其特征在于,所述训练方法还包括:

5.一种规划控制模型的训练方法,其特征在于,应用于服务端,所述训练方法包括:

6.如权利要求5所述的训练方法,其特征在于,根据所述场景数据和所述实际控制数据对规划控制模型进行更新,以得到更新后的所述规划控制模型之前,包括:

7.一种规划控制方法,其特征在于,应用于车载端,所述规划控制方法包括:

8.一种规划控制模型的训练装置,其特征在于,应用于车载端,所述训练装置包括:

9.一种规划控制模型的训练装置,其特征在于,应用于服务端,所述训练装置包括:

10.一种规划控制装置,其特征在于,应用于车载端,所述规划控制装置包括:

11.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如权利要求1-6中任一项所述的规划控制模型的训练方法,或权利要求7所述的规划控制方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令或者至少一段程序,至少一条指令或者至少一段程序由处理器加载并执行以实现如权利要求1-6中任一项所述的规划控制模型的训练方法,或权利要求7所述的规划控制方法。


技术总结
本公开提供了一种规划控制方法及模型训练方法、装置、设备及介质,训练方法包括:对车辆的场景数据,以及场景数据所对应生成的规划控制数据和实际控制数据进行采集;对规划控制数据和实际控制数据进行比对,得到比对结果;在比对结果满足预设比对条件的情况下,将场景数据和对应的实际控制数据上传至服务端,服务端用于对规划控制模型进行更新,以得到更新后的规划控制模型,规划控制模型用于根据场景数据生成对应的规划控制数据,通过场景数据和实际控制数据对规划控制模型进行更新,以提升规划控制模型的智能化程度,进而提升车辆的驾驶性能和用户体验感。

技术研发人员:姚倩婷
受保护的技术使用者:中汽创智科技有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-21251.html

最新回复(0)