本发明涉及数据处理,尤其涉及一种预测模型训练方法、旅客量预测方法、装置及电子设备。
背景技术:
1、国际航线作为不同国家之间最为重要的交通方式之一,如何高效精准地对国际航班旅客量预测是目前业界亟待解决的技术问题之一。
2、相关技术中在对航班旅客量进行预测时,通常需要大量的历史数据和先验知识构建预测模型,同时需要长期、持续的观测数据,才能训练得到具备较好的预测性能的预测模型;而由于数据隐私保护的限制,不同航司之间所记录的航班的承运旅客量数据无法实时大量共享,全市场旅客量缺失,而在预测未来航线全市场流量之前,需要获取到历史全市场旅客量才能精准进行模型训练,由此使得训练样本数据匮乏,导致无法训练出高性能的预测模型,进而难以精准地预测出航线的旅客量。
3、因此,亟需一种预测模型训练方法、旅客量预测方法、装置及电子设备来解决上述问题。
技术实现思路
1、本发明提供一种预测模型训练方法、旅客量预测方法、装置及电子设备,用以解决现有技术中由于数据隐私保护的限制,导致难以精准地预测出各航司的旅客量的缺陷,实现提高旅客量的预测准确性。
2、本发明提供一种预测模型训练方法,应用于目标数据存储系统,所述方法包括:
3、根据待处理航线的航线信息,获取与所述待处理航线关联的目标航线;
4、根据所述目标航线对应的第一历史承运旅客总量、第一计划销售座位总数、第二历史承运旅客总量、第二计划销售座位总数、第三计划销售座位总数,以及第一历史日期对应的时间特征数据,推断得到所述待处理航线在所述第一历史日期的历史承运旅客总量推断结果;
5、根据所述待处理航线在所述第一历史日期的历史承运旅客总量推断结果,以及所述第一历史日期对应的时间特征数据和所述第一历史日期对应的外生变量,对初始模型进行迭代训练,得到旅客量预测模型;
6、其中,所述第一历史承运旅客总量和所述第一计划销售座位总数分别为在所述目标航线下,第一航司在所述第一历史日期的实际承运旅客总量和计划销售座位总数;所述第二历史承运旅客总量和所述第二计划销售座位总数分别为在所述目标航线下,所述第一航司在所述第一历史日期之前的第二历史日期的实际承运旅客总量和计划销售座位总数;所述第三计划销售座位总数为在所述目标航线下,第二航司在所述第一历史日期的计划销售座位总数;所述第一历史日期对应的外生变量是根据所述待处理航线的目的地和出发地在所述第一历史日期的物价之间的比例系数确定的;所述第一航司为所述目标数据存储系统所存储的航司;所述第二航司为除所述目标数据存储系统所存储的航司之外的其他地区航司。
7、根据本发明提供的一种预测模型训练方法,所述根据待处理航线的航线信息,获取与所述待处理航线关联的目标航线,包括:
8、根据所述待处理航线的航线信息,在所述目标数据存储系统中,查找与所述待处理航线相同的航线;
9、若查找到与所述待处理航线相同的航线,则将与所述待处理航线相同的航线作为所述目标航线;
10、若未查找到与所述待处理航线相同的航线,则根据所述待处理航线的航线信息,获取所述待处理航线的行程线路、出发机场的位置坐标和目的机场的位置坐标,并根据所述待处理航线的行程线路、出发机场的位置坐标和目的机场的位置坐标,在所述目标数据存储系统中,获取所述目标航线。
11、根据本发明提供的一种预测模型训练方法,所述根据所述待处理航线的行程线路、出发机场的位置坐标和目的机场的位置坐标,在所述目标数据存储系统中,获取所述目标航线,包括:
12、根据所述目标数据存储系统中各历史航线的行程线路与所述待处理航线的行程线路之间的夹角,以及各所述历史航线的行程线路的距离,确定各所述历史航线与所述待处理航线之间的第一相对距离;
13、根据所述待处理航线的出发机场的位置坐标到各所述历史航线的行程线路的垂线段长度,以及所述待处理航线的目的机场的位置坐标到各所述历史航线的行程线路的垂线段长度,确定各所述历史航线与所述待处理航线之间的第二相对距离;
14、根据所述待处理航线的出发机场的位置坐标在各所述历史航线的行程线路的投影到各所述历史航线的出发机场的位置坐标之间的距离,以及所述待处理航线的目的机场的位置坐标在各所述历史航线的行程线路的投影到各所述历史航线的目的机场的位置坐标之间的距离,确定各所述历史航线与所述待处理航线之间的第三相对距离;
15、根据所述第一相对距离、所述第二相对距离,以及所述第三相对距离,在多个所述历史航线中,确定所述目标航线。
16、根据本发明提供的一种预测模型训练方法,所述根据所述第一相对距离、所述第二相对距离,以及所述第三相对距离,在多个所述历史航线中,确定所述目标航线,包括:
17、对所述第一相对距离、所述第二相对距离和所述第三相对距离进行加权融合,得到各所述历史航线与所述待处理航线之间的总相对距离;
18、在多个历史航线中,确定总相对距离最小的航线作为所述目标航线。
19、根据本发明提供的一种预测模型训练方法,所述方法还包括:
20、获取多个所述第一历史日期、多个所述待处理航线,以及各所述待处理航线在各所述第一历史日期的历史承运旅客总量推断结果;
21、所述根据所述待处理航线在所述第一历史日期的历史承运旅客总量推断结果,以及所述第一历史日期对应的时间特征数据和所述第一历史日期对应的外生变量,对初始模型进行迭代训练,得到旅客量预测模型,包括:
22、在多个所述第一历史日期中,获取至少一个目标历史日期,以及各所述目标历史日期之前的多个历史日期;
23、将各所述待处理航线在各所述目标历史日期之前的多个历史日期的历史承运旅客总量推断结果,以及各所述目标历史日期对应的时间特征数据和各所述目标历史日期对应的外生变量,输入至所述初始模型,得到各所述待处理航线在各所述目标历史日期的承运旅客总量预测值;
24、根据各所述待处理航线在各所述目标历史日期的承运旅客总量预测值与各所述待处理航线在各所述目标历史日期的历史承运旅客总量推断结果之间的偏差,对所述初始模型进行迭代优化,得到所述旅客量预测模型。
25、根据本发明提供的一种预测模型训练方法,所述第一历史日期对应的时间特征数据是基于如下步骤获取的:
26、获取所述第一历史日期对应的日期数据;所述日期数据包括年份数据、月份数据、日数据和周数据中的至少一项;
27、判断所述第一历史日期和所述第一历史日期前后的多个日期是否为假期,得到所述第一历史日期对应的假期特征数据;
28、判断所述第一历史日期是否为调休日,得到所述第一历史日期对应的调休日特征数据;
29、根据所述日期数据、所述假期特征数据和所述调休日特征数据,获取所述第一历史日期对应的时间特征数据。
30、本发明还提供一种旅客量预测方法,包括:
31、获取待预测航线在待预测日期之前的第三历史日期的实际承运旅客总量,以及所述待预测日期对应的时间特征数据和所述待预测日期对应的外生变量;
32、将所述待预测航线在待预测日期之前的第三历史日期的实际承运旅客总量,以及所述待预测日期对应的时间特征数据和所述待预测日期对应的外生变量,输入至旅客量预测模型,得到所述待预测航线在所述待预测日期的承运旅客总量预测值;
33、其中,所述旅客量预测模型是基于如上述任一项所述预测模型训练方法训练得到。
34、本发明还提供一种预测模型训练装置,应用于目标数据存储系统,所述装置包括:
35、第一获取模块,用于根据待处理航线的航线信息,获取与所述待处理航线关联的目标航线;
36、推断模块,用于根据所述目标航线对应的第一历史承运旅客总量、第一计划销售座位总数、第二历史承运旅客总量、第二计划销售座位总数、第三计划销售座位总数,以及第一历史日期对应的时间特征数据,推断得到所述待处理航线在所述第一历史日期的历史承运旅客总量推断结果;
37、训练模块,用于根据所述待处理航线在所述第一历史日期的历史承运旅客总量推断结果,以及所述第一历史日期对应的时间特征数据和所述第一历史日期对应的外生变量,对初始模型进行迭代训练,得到旅客量预测模型;
38、其中,所述第一历史承运旅客总量和所述第一计划销售座位总数分别为在所述目标航线下,第一航司在所述第一历史日期的实际承运旅客总量和计划销售座位总数;所述第二历史承运旅客总量和所述第二计划销售座位总数分别为在所述目标航线下,所述第一航司在所述第一历史日期之前的第二历史日期的实际承运旅客总量和计划销售座位总数;所述第三计划销售座位总数为在所述目标航线下,第二航司在所述第一历史日期的计划销售座位总数;所述第一历史日期对应的外生变量是根据所述待处理航线的目的地和出发地在所述第一历史日期的物价之间的比例系数确定的;所述第一航司为所述目标数据存储系统所存储的航司;所述第二航司为除所述目标数据存储系统所存储的航司之外的其他地区航司。
39、本发明还提供一种旅客量预测装置,包括:
40、第二获取模块,用于获取待预测航线在待预测日期之前的第三历史日期的实际承运旅客总量,以及所述待预测日期对应的时间特征数据和所述待预测日期对应的外生变量;
41、预测模块,用于将所述待预测航线在待预测日期之前的第三历史日期的实际承运旅客总量,以及所述待预测日期对应的时间特征数据和所述待预测日期对应的外生变量,输入至旅客量预测模型,得到所述待预测航线在所述待预测日期的承运旅客总量预测值;
42、其中,所述旅客量预测模型是基于如上述任一项所述预测模型训练方法训练得到。
43、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述预测模型训练方法,或者实现如上述任一种所述旅客量预测方法。
44、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述预测模型训练方法,或者实现如上述任一种所述旅客量预测方法。
45、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述预测模型训练方法,或者实现如上述任一种所述旅客量预测方法。
46、本发明提供的预测模型训练方法、旅客量预测方法、装置及电子设备,通过与待处理航线关联的目标航线对应的第一历史承运旅客总量、第一计划销售座位总数、第二历史承运旅客总量、第二计划销售座位总数、第三计划销售座位总数,以及第一历史日期对应的时间特征数据,推断和补充获取待处理航线在第一历史日期的历史承运旅客总量推断结果,并依据各待处理航线在各第一历史日期的历史承运旅客总量推断结果,以及各第一历史日期对应的时间特征数据和各第一历史日期对应的外生变量构建形成大量的历史样本数据,以据此训练得到可根据所需进行旅客量预测的航线的历史实际承运旅客总量,以及未来日期的时间特征数据和未来日期对应的外生变量,精准预测得到该航线在未来日期的全市场航班的承运旅客总量预测值的旅客量预测模型,由此实现即使在数据隐私保护的限制下,也可以有效提高全市场旅客量预测的准确性,并且扩展了现有旅客预测模型的应用范围。
1.一种预测模型训练方法,其特征在于,应用于目标数据存储系统,所述方法包括:
2.根据权利要求1所述的预测模型训练方法,其特征在于,所述根据待处理航线的航线信息,获取与所述待处理航线关联的目标航线,包括:
3.根据权利要求2所述的预测模型训练方法,其特征在于,所述根据所述待处理航线的行程线路、出发机场的位置坐标和目的机场的位置坐标,在所述目标数据存储系统中,获取所述目标航线,包括:
4.根据权利要求3所述的预测模型训练方法,其特征在于,所述根据所述第一相对距离、所述第二相对距离,以及所述第三相对距离,在多个所述历史航线中,确定所述目标航线,包括:
5.根据权利要求1-4任一项所述的预测模型训练方法,其特征在于,所述方法还包括:
6.根据权利要求1-4任一项所述的预测模型训练方法,其特征在于,所述第一历史日期对应的时间特征数据是基于如下步骤获取的:
7.一种旅客量预测方法,其特征在于,包括:
8.一种预测模型训练装置,其特征在于,应用于目标数据存储系统,所述装置包括:
9.一种旅客量预测装置,其特征在于,包括:
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述预测模型训练方法,或者实现如权利要求7所述旅客量预测方法。