一种基于知识注入时空图卷积网络的大城市出租车需求预测方法

allin2026-02-01  13


本发明涉及一种大城市出租车需求预测方法,尤其涉及一种基于知识注入时空图卷积网络的大城市出租车需求预测方法。属于交通规划与管理领域。


背景技术:

1、出租车需求预测在交通管理十分重要,它能够帮助交通管理人员进行更好的科学决策以及车辆调度,从而减少出租车需求与供给不匹配现象发生。大城市出租车需求具有较强的时空差异,以及遇到极端天气、周末等外部因素会使预测结果误差大,因此考虑出租车需求空间和时间特征的同时,捕捉各种外部因素之间复杂相关性对出租车需求的影响是具有挑战性的。而现有研究很少考虑这些影响。因此能够捕捉出租车需求时空特征,且融合多源外部因素之间的复杂关系的出租车需求预测方法是当前待功课的技术难关,也是该本发明的动机。以下是关于交通预测的背景技术介绍。

2、(1)经典时间序列模型

3、经典时间序列预测是指使用传统的统计方法来分析和预测时间序列数据的技术。这些方法通常使用历史信息的时间序列数据,而不依赖于外部因素或者其他领域信息。经典时间序列模型如自回归移动平均模型(arima)是试图通过数据自相关性和差分的方式来提取隐藏在数据背后时间序列模式以此预测未来的数据。历史平均模型(ha)采用历史平均值对最后几个时间步长在起始点到终点的历史乘客流数据进行平均,作为下一个时间步长进行预测。但上述模型主要依赖于稳定的乘客流量,未能充分考虑交通状态变化对交通需求的影响,且难以捕捉复杂、高维度的动态时间序列数据。

4、(2)深度学习模型

5、深度学习模型也用于时间序列预测问题,如循环神经网络(rnn)适用于处理具有时间依赖的序列数据,但循环神经网络存在梯度消失和梯度爆炸问题,相继出现长短期记忆网络(lstm)和门控循环单元(gru),由于门控循环单元涉及训练参数较少,因此与多参数长短期记忆网络相比具有训练速度更快且不易过度拟合优点。

6、(3)先进深度学习模型

7、文献《noursalehi p,koutsopoulos h n,zhao j.dynamic origin-destinationprediction in urban rail systems:a multi-resolution spatio-temporal deeplearning approach[j].ieee transactions on intelligent transportation systems,2021,23(6):5106-5115.》提出mrstn模型,此模型包括多分辨率空间特征提取模块来捕获具有通道关注块的局部空间相关性以及辅助信息编码模块能够捕捉天气信息以及需求时间演变模式,但卷积神经网络(cnn)在不同区域之间的欧几里得相关性进行建模,缺少手动特征工程,不能进行远距离区域对之间相关性进行建模。因此,图卷积神经网络(gcns)能够对非欧几里德成对相关性进行建模,有助于在北京大城市场景下进行准确的出租车需求预测。文献《han l,ma x,sun l,et al.continuous-time and multi-level graphrepresentation learning for origin-destination demand prediction[c]//proceedings of the 28th acm sigkdd conference on knowledge discovery and datamining.2022:516-524》提出始发地到目的地需求预测的连续时间和多级动态图表示学习框架,首先该连续时间动态图能够根据最近发生历史出租车需求进行不断更新,多级结构学习模块对站级节点的空间性进行建模,有效捕捉交通需求的复杂时空依赖性.但交通需求会随着外源因素动态变化且上述方法未能同时考虑交通需求时空依赖以及外部因素之间相互作用对出租车需求进一步产生的影响。

8、因此克服上述缺陷,随本发明引入,能够描述外部因素之间关系的知识图谱模型transr,融合感知交通需求时空依赖和外部因素语义动态变化的动态融合单元,捕捉时空依赖的时空预测模型以及预测未来一小时出租车需求的时空预测模型,其中时空预测模型包含图卷积神经网络、门控循环单元以及全连接层三个组件。因此提出了一种基于知识注入及时空图卷网络的出租车需求预测模型odt-gcn,旨在同时考虑出租车需求强时空依赖关系与多源外部因素之间共同作用对出租车需求产生的影响,以此得到未来一个小时的出租车需求数量。


技术实现思路

1、本发明提出一种基于知识注入时空图卷积网络的出租车需求预测方法,目的是为了得到特大城市中起始点到终点的出租车需求数量,更好全面分析出租车需求时空特征以及外部因素之间相互作用对出租车需求所产生的影响,可以为交通管理人员进行更好车辆调度,优化资源配置,减少出租车供需不匹配现象以及提高乘客满意度等。

2、本发明的技术解决方案是这样实现的:

3、一种基于知识注入时空图卷积网络的大城市出租车需求预测方法,是用来预测未来一个小时内起始点和终点区域之间的出租车需求数量,其特征在于,包括如下步骤:

4、一、准备数据:准备天气、周末外部数据、区域联通关系文件和出租车需求时间序列文件;

5、二、数据处理:

6、(1)处理外部因素数据:首先,将天气与周末外部因素处理成实体三元组形式,其中天气三元组表示为(区域对,时间,天气),其中头部实体为区域对,关系是时间,天气是尾部实体,可以表示此区域对在不同时间段,它的天气变化情况;周末三元组表示为(周末早晚高峰期时间段,休息,区域对),其中头部实体为周末早晚高峰期时间段,关系为休息,尾部实体为区域对,可以说明此区域对在周末早晚高峰期时间段人们处于休息状态;区域邻接三元组表示为(起始点区域,连接,终点区域),头部实体为起始点区域,关系为连接,尾部实体为终点区域,表达出租车需求流向情况,将上述三元组文件进行整合能够全面表示交通实体三元组关系;

7、(2)处理时间数据:将出租车需求订单数据构建成时间序列文件t∈rh×n,其中h表示历史时间序列长度,表示历史时间序列长度中每个小时的不同区域对中的出租车需求订单数量,其中n表示节点数量,节点表示区域对;

8、(3)处理空间数据:根据北京出租车订单数据来构建区域联通文件:我们将o∈rn×n视为一个邻接矩阵,若oi,j=1,说明区域i与区域j之间存在关联,否则为0,其中i是起始点区域,j为终点区域;

9、三、数据分析:为了验证天气和周末等外部因素对出租车需求的影响,并展示大城市(如北京)出租车需求的显著时空差异导致的供需不匹配现象,可以利用origin可视化分析软件进行全面分析,首先通过折线图展示一天中不同时段的天气变化和出租车需求量之间的关系,其次利用柱状图比较工作日与周末早晚高峰期(例如7-9点和17-19点)的出租车需求量差异,从中也可以发现某日出租车需求受到大雨极端天气和周末相互作用使出租车需求进一步减少,然后使用小提琴图展示大城市和小城市不同区域的出租车需求量分布情况,以揭示空间差异,接着通过立体折线图展示大城市和小城市在不同时段(如早高峰和晚高峰)的出租车需求分布情况,从而揭示时间差异,最后通过堆叠面积图展示北京大城市内热门区域的出租车供需情况,突出供需不平衡现象,通过这些可视化分析,可以深入理解大城市下出租车需求的时空动态,为城市规划和资源优化提供依据;

10、四、数据挖掘:将步骤二(1)整合好的天气、周末和区域实体三元组文件输送到transr知识图谱模型当中并进行训练1000次,从而获得天气、周末和区域实体三元组的语义文件xk,能够全面表示交通实体三元组之间的关联;

11、首先,映射投影矩阵将实体投影向量定义为:

12、hr=hmr,tr=tmr                                   (1)

13、其中h表示头部实体,t表示尾部实体,r表示头部实体与尾部实体之间的关系,实体嵌入设置h,t∈rp,关系嵌入设置r∈rg,将实体空间中的实体通过矩阵mr投影到r关系空间当中,分别由hr和tr满足hr+r≈tr,对于每个关系r,相应设置一个投影矩阵mr∈rp*g,可以将实体从实体空间投影到关系空间;

14、其次,为了衡量实体和关系之间的相似度以及相关程度,使用得分函数定义为:

15、

16、最后,在transr知识图模型训练过程中,此模型会约束实体与关系嵌入向量的范数,因此将||h||2≤1,||r||2≤1,||t||2≤1,||hr||2≤1,||tr||2≤1,因此,transr模型可以对实体三元组所表示外部因素之间复杂相关性进行训练1000次来生成实体与关系语义嵌入文件为xk;

17、五、数据融合:此阶段采用动态因素融合单元是为了使交通需求信息来感知外部语义信息动态变化,采用动态融合单元可以将步骤步骤二(2)得到乘客对出租车需求信息t∈rh×n和步骤四得到外部因素内部之间复杂相关性xk进行融合,使二者产生关联,得到更新后的区域表示x′t,动态因素融合单元公式如下所示:

18、xs=leakyrelu(xk.t.w+b)

19、x′t=[xs]                                                    (3)

20、其中,leakyrelu是激活函数,w是线性变换,b是偏置项,x′t表示时间t的交通需求信息t与外部语义信息xk融合所得到更新后的区域特征表示。

21、六、提取时空特征:为了捕获出租车需求时空依赖,首先,使用步骤步骤二(3)得到的区域联通关系表示o与步骤五得到更新后的区域特征表示x′t作为图卷积神经网络的输入,它可以根据步骤步骤二(3)所构建邻接矩阵oi,j来捕捉起始点区域与终点区域之间的关联进而挖掘乘客有价值的流向模式,从而得到每个区域的向量表示,其公式为:

22、

23、其中σ是激活函数,o是邻接矩阵,是具有自连接的邻接矩阵,是的度矩阵,w(l)是l-th个卷积层的权重矩阵,h(l)是第l-th层的节点特征非线性组合的输出;

24、其次,为了将知识图谱模型所导出外部因素知识表示与od需求时间相关性进行集成,我们进一步使用门控递归单元(gru)来展示知识注入交通需求预测的整个工作流程,从而得到每个区域对的出租车需求预测结果,门控循环单元具体公式为:

25、rt=σ(wr.h([x′t,ht-1],o)+br)

26、zt=σ(wz.h([x′t,ht-1],o)+bz)

27、nt=tanh(wn.h([x′t,(rt⊙ht-1)],o)+bn)

28、ht=rt⊙ht-1+(1-rt)⊙nt                         (5)

29、其中[.]表示将更新后的区域特征x′t与t-1时刻交通需求信息ht-1进行串联达到融合目的;rt表示更新门,它控制过去记忆信息对当前时间步的影响,既可以保留当前时刻输入,也可以丢弃无关交通需求预测的历史信息,有助于捕捉时间序列里的短期依赖关系,zt是重置门,可以控制前一时刻状态信息带入到当前状态以此用于更新记忆,wr、wz、wn和br,bz,bn分别代表权重和偏置项,状态ht表示更新门和新的候选隐藏状态来计算当前时间步的隐藏状态,⊙表示逐元素相乘,o表示邻接矩阵;

30、七、校准预测结果:在模型训练阶段,我们致力于最小化预测值和实际值之间的误差,来提高模型鲁棒性,因此将步骤六当中时空预测模型学习到的外部因素语义特征以及交通需求时空特征等馈送到全连接层,来预测未来一个小时乘客对出租车的交通需求.其中,损失函数公式为:

31、

32、其中,y和代表真实交通需求与预测交通需求信息,||.||用于最小化两者之间差异,lreg代表回归损失函数,避免过度拟合的正则项,λ是一个超参数;

33、八、预测结果评估:基于步骤七得到的校正预测结果,利用均方根误差rmse,平均绝对误差mae以及平均绝对百分比误差mape作为衡量指标,并以其他基线模型相比较来评估模型预测效果,其衡量指标公式如下:

34、

35、其中和第i时刻乘客出租车需求的真实值和预测值,m是时间样本数,n代表od对的数量,均方根误差和绝对平均误差是为了测量真实值与预测值之间的误差,当误差值越小,说明模型预测精度效果越好,经实验验证,我们提出的odt-gcn模型在rmse和mape评估指标优于其它8个预测模型,分别为两个传统时间序列模型,其包括历史平均模型(ha)和差分整合移动平均自回归模型(arima);三个深度学习模型,其包括长短期记忆网络(lstm)、门控循环单元(grus)和图卷积神经网络(gcns);三个先进深度学习模型,其包括时间图卷积网络(t-gcn)、属性增强时空图卷积网络(ast-gcn)以及自适应图卷积递归网络(agcrn)。

36、本发明的创新点包括以下几个方面:

37、1、利用知识图谱模型transr将天气与周末外部因素之间复杂相关性以及区域联通关系均以实体三元组形式进行知识表示,有助于提高预测模型可解释性;

38、2、考虑周末早晚高峰期和天气外部因素对交通需求的影响,使用了动态融合单元使交通需求信息来融合并感知外源因素语义信息的动态变化,以此来提高对出租车需求的预测精度;

39、3、对于大城市如北京具有复杂区域结构以及动态时间依赖,因此使用图卷积神经网络、门控循环单元以及全连接层来捕获出租车需求的复杂时空依赖关系。此方法旨在提高出租车需求的预测精度且有效缓解出租车供需不匹配问题;4、在北京神州优车真实场景下验证odt-gcn模型要优于8个基线预测模型。


技术特征:

1.一种基于知识注入时空图卷积网络的大城市出租车需求预测方法,是用来预测未来一个小时内起始点和终点区域之间的出租车需求数量,其特征在于,包括如下步骤:


技术总结
一种基于知识注入时空图卷积网络的大城市出租车需求预测方法,准备天气和周末外部数据、区域连通性及出租车需求时间序列文件;将天气与周末数据构造成实体三元组,空间依赖关系构建成区域连通性文件,时间依赖关系构建成时间序列文件;用TransR知识图谱模型挖掘天气和周末实体三元组本身及相互间的关系;用动态融合单元将出租车需求数据与TransR所得到的实体和关系语义嵌入文件进行融合感知,得到更新后的区域表示;将区域连通性文件与更新后的区域表示馈送到时空图卷积网络得到出租车需求时空依赖关系,将其馈送到全连接层预测未来出租车需求数量。本发明提高出租车需求预测精度,帮助政府和交通部门优化资源配置,减少乘客需求与供给不匹配现象发生。

技术研发人员:佟宁,于学辉,李凤岐
受保护的技术使用者:大连交通大学
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-26095.html

最新回复(0)