1.本发明涉及船舶轨迹预测技术领域,尤其涉及一种基于改进编解码器架构的序列到序列渔船轨迹预测方法。
背景技术:2.在交通密度高、条件复杂的海域或港口,提高海上航行船舶的安全性是一个关键问题。船舶交通服务(vts)的目标是准确有效地监测和预测船舶轨迹和实时船舶轨迹,为海上交通事故的预警提供有价值的技术支持。为提高船舶在复杂多变海域航行的安全性,需要为船舶智能导航系统提供轨迹预测和危险预警功能。
3.与车辆运动不同,船舶海上运动不受几何结构的限制,预测的难度更大。传统的轨迹预测方法主要分为两种,基于船舶运动学的方法和基于统计学的方法。两种方法多用于短期轨迹预测,基于统计学方法存在对缺失数据不敏感和模型复杂的问题,例如,马尔可夫模型和高斯过程等。基于运动学的方法存在预测时间长和预测精度低的问题,例如非线性滤波和自适应核密度估计等。
4.近年来,循环神经网络(recurrent neural network,rnn)通过创建数据的动态表示来学习序列的时间模式,进行轨迹预测任务,但其梯度消失问题影响长期依赖关系捕获。rnn变体lstm(long short-term memory)长短期记忆网络模型和门控循环单元gru(gate recurrent unit)克服了这一限制,有效提高了长时间序列预测的精度。lstm编解码器模型具有模型简单、预测时间快的特点,已被用于船舶轨迹预测任务。该模型使用lstm编码器将输入轨迹序列编码为一组向量表示,然后由lstm解码器根据编码生成预测轨迹序列。然而,由于该模型在编码器阶段生成的固定向量无法表示完整船舶轨迹特征,使其在复杂交通模式下的船舶轨迹任务中预测精度降低。
技术实现要素:5.本发明的目的在于解决编解码器架构中编码器在特征提取方面的不足和海上交通模式复杂程度差别较大引起的预测精度低的问题,提供了一种基于改进编解码器架构的序列到序列渔船轨迹预测方法,通过对不同时间尺度的轨迹进行特征提取,提高轨迹预测精确度。
6.基于渔船的状态延续性与快速切换性特点以及近海区域交通模式复杂的环境,本发明使用全局卷积结构和局部卷积结构两个并行卷积分量改进编码器,并结合lstm解码器实现复杂交通模式下的渔船轨迹预测。
7.本发明所采用的技术方案步骤如下:
8.本发明包含以下步骤:
9.步骤1:对存储ais数据的mpp数据库建立空间索引,使用空间区域包含搜索方式提取近海区域渔船的运动信息;
10.步骤2:对近海区域渔船轨迹数据进行预处理,获取ais数据集;
11.步骤3:构建基于改进编解码器的序列到序列渔船轨迹预测模型,利用步骤2数据对其进行训练;
12.步骤4:利用训练好的改进渔船轨迹预测模型,对渔船下一时间段轨迹进行预测。
13.所述的改进编解码器的序列到序列渔船轨迹预测模型,包括改进的编码器和lstm解码器;
14.所述的改进编码器包含全局时间卷积和局部时间卷积两个并行卷积结构;
15.所述的序列到序列预测是指输入给定在时间步长k之前的t个历史船舶位置序列预测在时间步长k之后的t个船舶未来位置序列
16.进一步地,所述的mpp数据库是用于存储渔船运动信息的数据库,可以实现快速提取特定时间和区域的渔船轨迹数据。
17.进一步地,所述的渔船运动信息包括渔船静态信息海上移动服务标识mmsi和运动学信息时间time、经度lon、维度lat、对地速度sog;
18.进一步地,所述的对近海渔船轨迹进行预处理,包括:对于轨迹数据集,以固定报位间隔时间δ进行采样;对采样后的数据采用0均值归一化方法(z-score)进行归一化,得到归一化数据;对归一化数据使用滑动窗口划分,获取ais数据集。
19.进一步地,所述的全局时间卷积包含输入层、卷积层和dropout层;
20.所述的输入层的输入数据长度为t;
21.所述的卷积层包含16个20*2的卷积核。
22.进一步地,所述的局部时间卷积包含输入层、卷积层、池化层和dropout层:
23.所述的输入层的输入数据长度为t;
24.所述的卷积层包含16个5*2的卷积核;
25.所述的池化层采用最大池化操作。
26.进一步地,所述的dropout层的比率为0.1。
27.进一步地,所述的lstm解码器使用单向lstm单元。
28.进一步地,所述的编码器包含的全局时间卷积和局部时间卷积的输出激活函数采用relu函数。
29.本发明具有的有益效果是:本发明提出了一种基于改进编解码器架构的序列到序列渔船轨迹预测方法,其采用两个并行的卷积分量改进编码器,通过提取全局和局部时间模式的复杂混合的特征表示,有效地避免了编解码器体系结构在特征提取方面的不足,提高序列轨迹预测精确度。
附图说明
30.图1为本发明提供的一种基于改进编解码器架构的序列到序列渔船轨迹预测方法的流程图;
31.图2为本发明提供的编解码器架构示意图;
32.图3为本发明提供的渔船轨迹预测模型结构示意图;
33.图4为本发明提供的轨迹预测效果示意图。
具体实施方式
34.下面结合附图对本发明提供的技术方案进行进一步说明。
35.参见图1,一种基于改进编解码架构的序列到序列渔船轨迹预测方法,包括以下步骤:
36.步骤1:对存储ais数据的mpp数据库建立空间索引,使用空间区域包含搜索方式提取近海区域渔船的轨迹数据;
37.所述的mpp数据库是用于存储渔船运动信息的数据库,可以实现快速提取特定时间和区域的渔船轨迹数据;
38.所述的渔船轨迹数据包括渔船静态信息海上移动服务标识mmsi和运动学信息时间time、经度lon、维度lat、对地速度sog。
39.步骤2:对近海区域渔船轨迹数据进行预处理,获取ais数据集;
40.所述的对近海区域渔船轨迹数据预处理包括:
41.对于轨迹数据,以固定报位间隔时间δ进行采样;
42.对采样后的数据采用0均值归一化方法(z-score)进行归一化,得到归一化数据;
[0043][0044][0045]
其中lon和lat表示归一化前的经纬度数据,lon
′
和lat
′
表示归一化后的经纬度数据,lon
mean
和lat
mean
表示数据的均值,lon
std
和lat
std
表示数据的标准差。
[0046]
对归一化数据使用滑动窗口划分,获取ais数据集。
[0047]
步骤3:构建基于改进编解码器的序列到序列渔船轨迹预测模型,利用步骤2数据对其进行训练,具体实现步骤如下:
[0048]
所述的编解码器体系结构如图2所示,编解码体系结构主要包含编码器和解码器两部分,常见的方式是使用rnn或其变体lstm、gru作为编码器和解码器的组件,然而这种方式的编码器对序列编码后的固定向量(序列编码)并不能表示完整的序列特征;
[0049]
所述的渔船轨迹预测模型如图3所示,考虑到渔船轨迹的快速突变性以及状态延续性,并结合卷积结构在特征提取和并行计算的能力。模型基于编解码器架构使用全局时间卷积和局部时间卷积两个并行结构对编码器进行改进,全局时间卷积捕获时间步长之间的长期依赖关系,而局部时间卷积侧重于对局部时间模式进行建模;解码器使用lstm作为组件,lstm克服了循环神经网络存在的梯度消失问题,可以很好的进行轨迹预测。
[0050]
模型的输入为:x=《x
(1)
,x
(2)
,
…
,x
(d)
》
[0051]
其中
[0052]
模型的输出为:y=《y
(1)
,y
(2)
,
…
,y
(d)
)
[0053]
其中
[0054]
其中x和y表示包含d条轨迹的轨迹矩阵,x、n=3;其中x(i)和y(i)表示第i条轨迹包含t个轨迹点矩阵,x(i)、n=2;和表示第i条轨迹的第k个轨迹点,这里和为经纬度;其中x表示输入轨迹矩阵,y表示输出预测轨迹矩阵。
[0055]
所述的全局时间卷积包含输入层、卷积层和dropout层,卷积层由宽度t和高度n=2(高度设置为变量数量相同)的多个滤波器组成,最终得到输出矩阵hg:
[0056]
hg=relu(wg*x+bg)
[0057]
其中*表示卷积运算,relu函数为relu(x)=max(0,x),wg和bg分别为全局时间卷积的权重矩阵和偏置矩阵。输出矩阵hg的大小为d
×
ng,其中ng是全局时间卷积中的滤波器数量,d为输入轨迹序列数量;且使用dropout防止对数据的过拟合。
[0058]
所述的局部时间卷积包含输入层、卷积层、池化层和dropout层,卷积层由宽度l(l<t是一个超参数)和高度n=2(高度设置为变量数量相同)的多个滤波器组成,池化层使用1-d最大池化(maxpooling)捕捉最具代表性的特征,最终得到输出矩阵h
l
:
[0059]hl
=maxpooling(relu(w
l
*x+b
l
))
[0060]
其中*表示卷积运算,maxpooling为1-d最大池化,relu函数为relu(x)=max(0,x),w
l
和b
l
分别为局部时间卷积的权重矩阵和偏置矩阵。输出矩阵h
l
的大小为d
×nl
,其中n
l
是局部时间卷积中的滤波器数量,d为输入轨迹序列数量;且使用dropout防止对数据的过拟合。
[0061]
进一步地,在得到全局时间卷积和局部时间卷积的输出矩阵之后,将两个输出矩阵进行拼接(concat)。
[0062]
所述的lstm由一组内存块组成,每个内存块包含一个单元状态和三个门(sigmoidal单元):一个用于控制输入如何改变单元状态的输入门,一个用于设置输出单元状态的哪一部分的输出门,以及一个用于决定保留多少内存的遗忘门。具体地,存储器单元在当前时间步长x
t
处获取输入向量,在上一时间步长处获取隐藏状态h
t-1
,使用以下等式更新内部隐藏状态h
t
:
[0063]it
=σ(uix
t
+w
iht-1
+bi)
[0064]ft
=σ(ufx
t
+wfh
t-1
+bf)
[0065]ot
=σ(uox
t
+w
oht-1
+bo)
[0066][0067][0068]ht
=o
t
⊙
tanh(c
t
)
[0069]
其中
⊙
表示各个元素的乘积,σ表示sigmoid函数,tanh是双曲正切函数,i,f,o,和分别是输入门、遗忘门、输出门、细胞输入激活和细胞状态向量;w和u是权重矩阵,b是偏置项;权重矩阵下标表示输入和输出连接,例如:wf隐藏状态权重矩阵,uf输入遗忘矩阵。
[0070]
进一步地,将解码器输出结果通过全连接(fc)获取输出预测序列。
[0071]
步骤4:利用训练好的改进渔船轨迹预测模型,实现渔船轨迹预测,预测效果如图4所示,可见预测轨迹与真实轨迹基本拟合,预测效果良好。
[0072]
下面对本发明的方法的具体应用于渔船轨迹预测的实验和分析过程进行介绍:
[0073]
在应用中的渔船轨迹预测的实验平台是一台硬件配置为2.9ghz六核intel i5-9400cpu,20gb内存,intel uhd graphics 630的计算机。数据集选取中国东海渔船高速航行轨迹数据,包含2021年1月28日到2021年2月1日1469艘渔船的439207条ais报告数据作为实验数据。由于区域内交通模式的差异会导致模型的性能随区域的变化而产生不同的预测
性能,基于此类情况对数据集进行调整。首先,较小的区域内渔船的交通模式相对简单,从而会使模型的预测效果会更好。其次,基于对编解码模型的改进,选取了经度在121.3至121.7、维度在30.4至30.9的近海区域的渔船历史轨迹作为实验数据集。分别在小区域简单交通模式和大区域复杂交通模式的近海海域数据集上进行实验,将改进轨迹预测模型与编解码器模型进行对比效果。根据渔船轨迹长度不相同的问题,数据集按照每条渔船轨迹的长度分为训练集(60%)、验证集(20%)和测试集(20%)。
[0074]
表1
[0075][0076]
表1总结了模型在所有数据集上的评估结果,表中每一行展示了模型在特定区域的测试集上的评价结果。在实验过程中,本发明探索了卷积神经网络在特征提取方面的特点,并在不同区域测试集上得到所有评价结果。从表中可以得出,单独使用一个卷积神经网络和本发明提出的双卷积改进模型相比,无法提取到输入轨迹段的完整特征,预测的效果较差。同时,与编解码器模型相比,单卷积结构模型预测性能没有提升,评价指标比编解码模型偏低。然而,本发明和编解码器模型相比,在不同的区域数据集中的预测性能都提升较多,表明本发明在不同区域交通模式情况下更能捕捉到良好的输入渔船轨迹特征从而更好的预测渔船未来位置。
技术特征:1.基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于该方法包含以下步骤:步骤1:对存储ais数据的mpp数据库建立空间索引,使用空间区域包含搜索方式提取近海区域船舶的轨迹数据;步骤2:对近海区域船舶轨迹数据进行预处理,获取ais数据集;步骤3:构建基于改进编解码器的序列到序列船舶轨迹预测模型,利用步骤2数据对其进行训练,实现船舶轨迹预测;步骤4:利用训练好的改进船舶轨迹预测模型,实现船舶轨迹预测;所述的改进编解码器的序列到序列渔船轨迹预测模型,包括改进的编码器和lstm解码器;所述的改进编码器包含全局时间卷积和局部时间卷积两个并行卷积结构;所述的序列到序列预测是指输入给定在时间步长k之前的t个历史船舶位置序列预测在时间步长k之后的t个船舶未来位置序列2.如权利要求1所述的基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于:所述的对近海区域船舶轨迹数据预处理包括:对于轨迹数据,以固定报位间隔时间δ进行采样;对采样后的数据采用0均值归一化方法进行归一化,得到归一化数据;得到归一化数据;其中lon和lat表示归一化前的经纬度数据,lon
′
和lat
′
表示归一化后的经纬度数据,lon
mean
和lat
mean
表示数据的均值,lon
std
和lat
std
表示数据的标准差;对归一化数据使用滑动窗口划分,获取ais数据集。3.如权利要求1所述的基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于,所述的全局时间卷积包含输入层、卷积层和dropout层;所述的输入层的输入数据长度为t;所述的卷积层包含16个20*2的卷积核。4.如权利要求1所述的基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于,所述的局部时间卷积包含输入层、卷积层、池化层和dropout层:所述的输入层的输入数据长度为t;所述的卷积层包含16个5*2的卷积核;所述的池化层采用最大池化操作。5.如权利要求3或4所述的一种基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于,所述的dropout层的比率为0.1。6.如权利要求1所述的基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于,所述的lstm解码器使用单向lstm单元。7.如权利要求1所述的基于改进编解码器架构的序列到序列船舶轨迹预测方法,其特征在于:所述的编码器包含的全局时间卷积和局部时间卷积的输出激活函数采用relu函数。
技术总结本发明公开了一种基于改进编解码器架构的序列到序列船舶轨迹预测方法。传统的编解码器方法无法捕捉完整的船舶轨迹序列表示并进行有效的预测。本发明基于编解码器架构,提出了一种改进编解码器架构序列到序列的船舶轨迹预测方法,它由两个并行的卷积分量构成改进编码器和长短期记忆网络构成解码器。本发明提供的改进编解码器架构的序列到序列船舶轨迹预测方法具有更高的精度,在交通复杂的近海区域的船舶轨迹预测中具有一定的参考价值。域的船舶轨迹预测中具有一定的参考价值。域的船舶轨迹预测中具有一定的参考价值。
技术研发人员:王英杰 袁俊峰 张纪林 任永坚 万健 曾艳 欧东阳
受保护的技术使用者:杭州电子科技大学
技术研发日:2022.04.20
技术公布日:2022/7/5