一种基于基本驾驶操作事件的无监督驾驶风格分析方法

allin2022-09-03  105



1.本发明涉及交通分析技术领域,具体而言,涉及一种基于基本驾驶操作事件的无监督驾驶风格分析方法。


背景技术:

2.随着社会科技的发展,驾驶风格分析已成为研究热点。驾驶风格在道路安全、车辆经济性、车辆保险以及智能车设计等方面有着重要作用:对驾驶风格进行检测并实时向驾驶人反馈能够有效减少道路交通事故的发生;驾驶风格很大程度上影响了车辆的燃油经济性,越激进的驾驶行为,其燃油经济性越低;车辆保险费用也取决于车辆使用者的驾驶风格,对不同驾驶风格驾驶人制定不同保费能使保险公司利益最大化;随着人工智能的发展,智能车辆成为车辆相关行业发展新趋势,智能车辆的决策过程很大程度依赖于驾驶行为的分析,要想保证智能车辆的决策安全性以及提高用户的接受程度,驾驶风格有效分析是关键技术。因此,准确并高效的实现驾驶风格识别是当前关注的重点。
3.在大数据背景下,面对海量的自然驾驶数据,每一个小时的自然驾驶数据大约需要800工时标定,因此采用无监督方法对驾驶风格进行聚类分析是十分有必要的。聚类分析是一种用来数据挖掘的无监督机器学习算法,聚类分析可以寻找数据内在的分布结构,将特性相似的数据聚为一类,不同类型数据之间具有明显差异,扩大相似数据的相似性以及不同类型数据之间的差异,以提高解释性以及方便后续研究分析。
4.然而,现有驾驶风格分析仍然存在以下缺点:(1)缺乏从基本驾驶操作事件出发,同时考虑事件强度与事件转移特征的驾驶风格分析方法;(2)现有技术大多利用离散特征点表征驾驶风格,无法保留自然驾驶数据的连续性,遗漏时间特性;(3)现有驾驶风格聚类算法均是针对离散点的聚类算法,缺少针对不同长度连续曲线的聚类算法,无法实现基于连续型曲线特征对不同长度的数据样本进行驾驶风格高效准确的聚类分析。


技术实现要素:

5.本发明提供了一种基于基本驾驶操作事件的无监督驾驶风格分析方法,以解决现有驾驶风格分析方法存在的未从基本驾驶操作事件出发、未考虑事件强度与事件转移特征;利用离散特征点表征驾驶风格,无法保留自然驾驶数据的连续性,遗漏时间特性;缺少针对不同长度连续曲线的聚类算法,无法实现基于连续型曲线特征对不同长度的数据样本进行驾驶风格高效准确的聚类分析的问题。
6.本发明提供了一种基于基本驾驶操作事件的无监督驾驶风格分析方法,包括以下步骤:s1、获取自然驾驶数据,并对所述自然驾驶数据进行预处理,得到有效自然驾驶数据;s2、基于所述有效自然驾驶数据,提取基本驾驶操作事件;s3、基于所述有效自然驾驶数据,通过驾驶行为特征对所述基本驾驶操作事件中的每个事件进行特征构造和特征提取,得到表征每个事件强度的事件强度特征;s4、基于所述事件强度特征,通过k-means聚类算法对基本驾驶操作事件中的每个事件按照直行事件和转向事件进行事件强度聚类,并根据事件
强度特征的统计值,对聚类得到的各类事件打事件强度类别标签;s5、基于所述有效自然驾驶数据获取道路线形,并基于道路线形的变化按照直线路段和曲线路段获取动态时间窗;基于动态时间窗内事件强度类别和事件转移特征,构造表征动态时间窗内驾驶风格的已具有事件强度类别标签的事件随时间的变化曲线;基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的所述曲线进行聚类,得到各类时间窗曲线;基于事件强度特征和事件转移特征,对各类时间窗曲线打驾驶风格类型标签。
7.在本发明的一些实施方式中,所述自然驾驶数据包括速度、纵向加速度和侧向加速度,所述预处理包括异常数据剔除和数据平滑处理。
8.在本发明的一些实施方式中,所述基本驾驶操作事件包括六类驾驶操作事件,所述六类驾驶操作事件为直行加速、直行匀速、直行减速、转向加速、转向匀速和转向减速。
9.在本发明的一些实施方式中,步骤s2中提取基本驾驶操作事件的方法具体如下:s21、基于速度和侧向加速度,计算行驶轨迹半径:其中r为行驶轨迹半径,v为速度,ay为侧向加速度;s22、基于纵向加速度,构造纵向加速度波形;s23、基于行驶轨迹半径、纵向加速度波形的波峰值和/或波谷值提取基本驾驶操作事件。
10.在本发明的一些实施方式中,通过以下条件提取基本驾驶操作事件:设定行驶轨迹半径阈值为1000m,当行驶轨迹半径r》=1000m时,提取为直行事件;当行驶轨迹半径r《1000m时,提取为转向事件;设定纵向加速度波形波峰值阈值为1.0m/s2,纵向加速度波形波谷值阈值为-1.0m/s2,当纵向加速度波形波峰值》1.0m/s2时,提取为加速事件;当-1.0m/s2≤纵向加速度波形波峰值或波谷值≤1.0m/s2时,提取为匀速事件;当纵向加速度波形波谷值<-1.0m/s2时,提取为减速事件。
11.在本发明的一些实施方式中,步骤s3中获取表征每个事件强度的事件强度特征的方法具体如下:s31、以有效自然驾驶数据作为变量,基于各变量构造驾驶行为特征,其中,所述驾驶行为特征包括平均值、中位数、切尾均值、标准差、四分位差、绝对中位差、百分位数、最小值、最大值、香农熵和近似熵;s32、通过熵值法计算各变量的各驾驶行为特征权重;s33、基于各变量的各驾驶行为特征权重,通过以下多项式计算得到各变量强度特征:其中,var_idxi表示第i个事件var变量的强度特征,var=[有效自然驾驶数据]=[速度,纵向加速度,侧向加速度],w_s
vark
表示var变量的第k个驾驶行为特征权重,f
ik
为第i个事件var变量的第k个驾驶行为特征,k为各变量驾驶行为特征数;s34、基于各变量强度特征,通过主成分分析法计算各主成分方差贡献率和累积主成分贡献率,选取累积主成分贡献率≥90%的对应主成分作为有效主成分;s35、通过如下公式计算每个有效主成分的权重:其中,σm表示所选取的第m个有效主成分对应的方差贡献率,w_pm表示第m个有效主成分的权重,m表示有效主成分的个数;s36、基于有效主成分权重w_pm以及通过主成分分析法计算得到的相应的有效主成分载荷a
mvar
,通过如下公式计算表征每
个事件强度的事件强度特征:其中,event_idxi表示第i个事件的事件强度特征。
[0012]
在本发明的一些实施方式中,步骤s4中,基于所述事件强度特征,通过k-means聚类算法对基本驾驶操作事件中的每个事件按照直行事件和转向事件进行事件强度聚类后,基于轮廓系数和戴维森堡丁指数判定聚类结果;所述事件强度特征的统计值包括聚类后得到的直行事件和转向事件中每类事件强度特征的平均值、最大值、最小值和标准差,基于所述事件强度特征的统计值,对聚类得到的各类事件打事件强度类别标签。
[0013]
在本发明的一些实施方式中,步骤s5中,基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的所述曲线进行聚类,得到各类时间窗曲线的方法具体如下:1)、将各动态时间窗的所述曲线记为曲线集合c;2)、基于dtw算法计算曲线集合c中两两曲线之间的距离,选取两两曲线之间的距离最大的两条曲线中的任一曲线,记为曲线a,并设定曲线相似度距离阈值t;3)、将曲线a归入曲线集合c1中,并记曲线集合c=c-c1;4)、计算曲线集合c中各曲线与曲线集合c1的距离,得到最小距离所对应的曲线集合c中的曲线b,并记曲线集合c1’=c1+b;5)、计算曲线集合c1’类内相似度d(c1’),如果d(c1’)>t,则转至步骤2),否则将曲线b归入曲线集合c1,分别记曲线集合c1=cl+b,曲线集合c=c-c1,算法转至步骤4);6)、当算法运行至曲线集合c为空集时,算法终止。
[0014]
在本发明的一些实施方式中,所述曲线相似度距离阈值t为基于dtw算法计算出的曲线集合c中两两曲线之间的距离集合的百分位数,直线路段动态时间窗的百分位数为87百分位数,曲线路段动态时间窗的百分位数为50百分位数。
[0015]
在本发明的一些实施方式中,步骤s5中,基于事件强度类别和事件转移特征,对各类时间窗曲线打驾驶风格类型标签的方法具体如下:步骤一、通过以下公式计算第z类时间窗曲线的事件转移概率:其中,第z类时间窗曲线表示基于融合dtw的曲线聚类算法对各动态时间窗的所述曲线进行聚类后得到的各类时间窗曲线中的某一类时间窗曲线,θ
t
表示当前事件,θ
t+1
表示下一时刻的事件,evento表示当前时刻对应于s4步骤聚类的事件强度类别,event
l
表示下一时刻对应于s4步骤聚类的事件强度类别,n(θ
t
=evento,θ
t+1
=event
l
)表示某一类时间窗内从evento转移到event
l
这个转移形式的数量,n(θ
t+1
=event
l
)表示t+1时刻为event
l
的数量;步骤二、通过以下公式计算第z类时间窗曲线的事件转移概率香农熵:其中,eventr为第z类时间窗曲线中所涉及的事件强度类别数;步骤三、通过以下公式计算第z类时间窗曲线的转移倾向:其中,o为当前事件强度类别,为转移形式权重,为第z类时间窗曲线各转移形式转移前后事件强度类别跨度差,o=n且o、n均表示s4步骤聚类的事件强度类别数,event
z.
为转移后的事件强度
类别,为转移前的事件强度类别;步骤四、通过以下公式计算第z类时间窗曲线所包含的所有事件的事件强度平均值,作为第z类时间窗曲线的事件强度特性:其中,s为第z类时间窗曲线中曲线个数,为第s条曲线第t时刻对应的事件强度类别,t为第s条曲线持续的时间长度;步骤五、基于第z类时间窗曲线的事件转移概率香农熵、第z类时间窗曲线的转移倾向和第z类时间窗曲线的事件强度特性的数值大小,对各类时间窗曲线按照数值由小到大依次打谨慎型、正常型和激进型驾驶风格标签。
[0016]
与现有技术相比,本发明具有以下有益效果:
[0017]
(1)本发明获取的自然驾驶数据作为连续的时间序列数据,描述了驾驶人完成驾驶任务时复杂的驾驶行为,直接分析不利于从微观层面上对驾驶风格的差异进行理解,因此本发明根据有效自然驾驶数据提取基本驾驶操作事件,将基本驾驶操作事件作为描述驾驶人复杂驾驶行为的基本单元,能够从微观层面上体现驾驶行为特性并可体现驾驶行为的决策信息,有利于驾驶风格分析;另外,除了以基本驾驶操作事件为基本单元外,本发明分析方法还考虑了事件强度类别和事件转移特征,以事件随时间的变化曲线作为描述驾驶风格的特征,体现了驾驶行为的动态决策信息以及自然驾驶数据的连续性和时间特性,更好地保留了自然驾驶数据的原始信息,提高了驾驶风格分析结果的可解释性和准确性。
[0018]
(2)本发明基于有效自然驾驶数据进行特征构造,可全面表示数据信息,提高后续算法的准确性;通过特征提取减少特征数量,得到更具有代表性的特征并降低计算复杂度。
[0019]
(3)本发明驾驶风格分析方法采用了基于k-means和dtw的两种聚类算法,将k-means和dtw融合到本发明的分析方法中,实现在无监督条件下对驾驶风格的分析,突破了人工标定的限制。
[0020]
(4)本发明根据道路线形确定动态时间窗,保证时间窗内包含足够数量的事件,体现驾驶行为的动态决策,实现驾驶风格实时在线聚类分析,能够有效识别驾驶人不断变化的实时驾驶风格,并基于实时驾驶风格解释了驾驶人长期驾驶风格的构成;本发明针对曲线聚类,提出了一种考虑全局的具有动态时间扭曲相似性度量的融合dtw的大规模曲线聚类方法,基于融合dtw的大规模曲线聚类算法,可针对不同长度曲线进行聚类,避免了现有技术采用层次聚类算法导致的局部最优化,本发明实现依据连续型特征曲线对动态时间窗驾驶风格的聚类分析,可以捕捉驾驶人不断变化的驾驶行为,实现驾驶风格的实时在线分析,能够有效捕捉不断变化的动态驾驶风格,使聚类结果更好地保留了自然驾驶数据的连续性和时间信息,准确有效地识别出驾驶风格并提高了驾驶风格聚类分析的可解释性及应用范围。
附图说明
[0021]
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例中所需要使用的附图进行说明。
[0022]
图1为本发明一种实施例的基于基本驾驶操作事件的无监督驾驶风格分析方法中基本驾驶操作事件曲线图;
[0023]
图2为本发明一种实施例的基本驾驶操作事件中直行事件和转向事件分布直方图;
[0024]
图3为本发明一种实施例的直行事件和转向事件中各变量构造的驾驶行为特征权重图;
[0025]
图4为本发明一种实施例的直行事件和转向事件中各变量强度特征分布图;
[0026]
图5为本发明一种实施例的直行事件和转向事件中各变量强度特征箱型图;
[0027]
图6为本发明一种实施例的直行事件和转向事件中各事件强度特征分布图;
[0028]
图7为本发明一种实施例的直行事件和转向事件的事件强度聚类指标变化图;
[0029]
图8为本发明一种实施例的直行事件和转向事件的事件强度聚类结果示意图;
[0030]
图9为本发明一种实施例的动态时间窗长度分布直方图;
[0031]
图10为本发明一种实施例的时间窗直行事件和转向事件划分结果示意图;
[0032]
图11为本发明一种实施例的直行事件和转向事件的事件强度类别随时间变化图;
[0033]
图12为本发明一种实施例的包含直行事件和转向事件的时间窗曲线聚类结果示意图;
[0034]
图13为本发明一种实施例的包含直行事件和转向事件的时间窗驾驶风格类别曲线图。
具体实施方式
[0035]
为使本发明的目的、技术方案和优点更加清楚,以下将结合具体实施例对本发明涉及的各个方面进行详细说明,但这些具体实施例仅用于举例说明本发明,并不对本发明的保护范围和实质内容构成任何限定。
[0036]
本实施例提供一种基于基本驾驶操作事件的无监督驾驶风格分析方法。图1示出了本实施例的基于基本驾驶操作事件的无监督驾驶风格分析方法中基本驾驶操作事件曲线图;图2示出了本实施例的基本驾驶操作事件中直行事件和转向事件分布直方图;图3示出了本实施例的直行事件和转向事件中各变量构造的驾驶行为特征权重图;图4示出了本实施例的直行事件和转向事件中各变量强度特征分布图;图5示出了本实施例的直行事件和转向事件中各变量强度特征箱型图;图6示出了本实施例的直行事件和转向事件中各事件强度特征分布图;图7示出了本实施例的直行事件和转向事件的事件强度聚类指标变化图;图8示出了本实施例的直行事件和转向事件的事件强度聚类结果示意图;图9示出了本实施例的动态时间窗长度分布直方图;图10示出了本实施例的时间窗直行事件和转向事件划分结果示意图;图11示出了本实施例的直行事件和转向事件的事件强度类别随时间变化图;图12示出了本实施例的包含直行事件和转向事件的时间窗曲线聚类结果示意图;图13示出了本实施例的包含直行事件和转向事件的时间窗驾驶风格类别曲线图。
[0037]
本实施例的一种基于基本驾驶操作事件的无监督驾驶风格分析方法,包括以下步骤:
[0038]
s1、获取自然驾驶数据,并对自然驾驶数据进行预处理,得到有效自然驾驶数据;
[0039]
s2、基于有效自然驾驶数据,提取基本驾驶操作事件;
[0040]
s3、基于有效自然驾驶数据,通过驾驶行为特征对基本驾驶操作事件中的每个事件进行特征构造和特征提取,得到表征每个事件强度的事件强度特征;
[0041]
s4、基于事件强度特征,通过k-means聚类算法对基本驾驶操作事件中的每个事件按照直行事件和转向事件进行事件强度聚类,并根据事件强度特征的统计值,对聚类得到的各类事件打事件强度类别标签;
[0042]
s5、基于有效自然驾驶数据获取道路线形,并基于道路线形的变化按照直线路段和曲线路段获取动态时间窗;基于动态时间窗内事件强度类别和事件转移特征,构造表征动态时间窗内驾驶风格的已具有事件强度类别标签的事件随时间的变化曲线;基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的曲线进行聚类,得到各类时间窗曲线;基于事件强度类别和事件转移特征,对各类时间窗曲线打驾驶风格类型标签。
[0043]
在本实施例中,s1步骤自然驾驶数据的获取方式不受限制,本领域技术人员可以根据实际情况对获取方式进行选择。在本实施例中,优选地,s1步骤自然驾驶数据具体使用交通运输部公路科学研究所(rios)研发的rads型8自由度全景驾驶模拟系统进行采集,该驾驶模拟系统进行交通模拟,被试驾驶员按照个人的驾驶习惯按模拟的交通(预先设定的路段路线)进行自由驾驶和自主换道,该驾驶模拟系统对被试驾驶员的自然驾驶数据进行采集。在本实施例中,自然驾驶数据包括速度、纵向加速度和侧向加速度。在驾驶模拟实验过程中,由于被试驾驶员操作失误或设备本身等原因,所采集到的自然驾驶数据存在异常或缺陷问题,需对自然驾驶数据进行预处理,本实施例的预处理包括异常数据剔除和数据平滑处理。在本实施例中,异常数据剔除和数据平滑处理的具体方法不受限制,本领域技术人员可以根据实际需要进行合理选择,例如可以采用滑动平均法进行数据平滑处理;异常数据的剔除方法可以如下:根据本领域中数据正常阈值进行异常值去除,纵向加速度和侧向加速度中大于10m/s2以及小于-10m/s2的数据点用其相邻的前3个数据点以及后3个数据点的平均值代替,速度大于36m/s的数据点用其相邻的前3个数据点以及后3个数据点的平均值代替。
[0044]
在本实施例中,s2步骤提取的基本驾驶操作事件包括六类驾驶操作事件,如图1-2所示,这六类驾驶操作事件为直行加速、直行匀速、直行减速、转向加速、转向匀速和转向减速。
[0045]
在本实施例中,步骤s2中提取基本驾驶操作事件的方法具体如下:
[0046]
s21、基于速度和侧向加速度,计算行驶轨迹半径:其中r为行驶轨迹半径,v为速度,ay为侧向加速度;
[0047]
s22、基于纵向加速度,构造纵向加速度波形(在本实施例中,纵向加速度的完整波形为纵向加速度从0增加(减少)到一定数值后又减少(增加)到0的过程);
[0048]
s23、基于行驶轨迹半径、纵向加速度波形的波峰值和/或波谷值提取基本驾驶操作事件。
[0049]
在本实施例中,s23步骤通过以下条件提取基本驾驶操作事件:设定行驶轨迹半径阈值为1000m,当行驶轨迹半径r》=1000m时,提取为直行事件;当行驶轨迹半径r《1000m时,提取为转向事件;设定纵向加速度波形波峰值阈值为1.0m/s2,纵向加速度波形波谷值阈值为-1.0m/s2,当纵向加速度波形波峰值》1.0m/s2时,提取为加速事件;当-1.0m/s2≤纵向加速度波形波峰值或波谷值≤1.0m/s2时,提取为匀速事件;当纵向加速度波形波谷值《-1.0m/s2时,提取为减速事件。需要说明的是,驾驶员实际驾驶过程中,由于驾驶行为受到驾
驶人的直接控制,不论是加速驾驶、匀速驾驶还是减速驾驶,其或多或少都会伴随着加速度的变化,例如,加速行为一般不是以恒定加速度加速,减速行为一般不是以恒定加速度减速,匀速行为一般也不能保证加速度一直为零(其或多或少会存在微小的加速度变化,但在乘车人体感或外部观察下,由于加速度较小,可忽略,故呈现匀速行为),为更准确的判断出基本驾驶操作事件,防止将伴随着微小加速度变化的匀速行为误判为加速行为或减速行为,本实施例以所采集并预处理后的有效自然驾驶数据中的纵向加速度构造纵向加速度波形,并基于预设的纵向加速度波形波峰值阈值、预设的纵向加速度波形波谷值阈值和构造的纵向加速度波形的波峰值和波谷值来判断加速、匀速和减速事件,考虑到了驾驶人人为控制驾驶行为时不论加速、匀速还是减速驾驶或多或少带来的加速度变化的影响,能够更准确的判断加速、匀速和减速事件,防止事件误判。本实施例综合考虑行驶轨迹半径阈值、纵向加速度波形波峰值阈值和纵向加速度波形波谷值阈值,即可自动提取直行加速、直行匀速、直行减速、转向加速、转向匀速和转向减速共六类驾驶操作事件。
[0050]
在本实施例中,步骤s3中获取表征每个事件强度的事件强度特征的方法具体如下:
[0051]
s31、以有效自然驾驶数据作为变量参数,基于各变量构造下表1的驾驶行为特征,以此表示驾驶行为在各变量上的操作特性;其中,驾驶行为特征包括平均值、中位数、切尾均值、标准差、四分位差、绝对中位差、百分位数、最小值、最大值、香农熵和近似熵;
[0052]
表1变量参数及构造的驾驶行为特征
[0053][0054]
s32、通过熵值法计算各变量的各驾驶行为特征权重(在本实施例中,熵值法是一种常用的底层指标权重计算方法,它根据熵值衡量变量数据的离散程度,变量熵值越小,变量的离散程度越大,该变量的权重也就越大。熵值法作为本领域公知方法,在此不再赘述),如图3所示,示出了本实施例得到的直行事件和转向事件中各变量构造的驾驶行为特征权重;
[0055]
s33、基于各变量的各驾驶行为特征权重,通过以下多项式计算得到各变量强度特征(如图4示出了本实施例得到的直行事件和转向事件中各变量强度特征分布图;如图5示出了本实施例得到的直行事件和转向事件中各变量强度特征箱型图):
[0056][0057]
其中,var_idxi表示第i个事件var变量的强度特征,var=[有效自然驾驶数据]=[速度,纵向加速度,侧向加速度],w_s
vark
表示var变量的第k个驾驶行为特征权重,f
ik
为第i个事件var变量的第k个驾驶行为特征,k为各变量驾驶行为特征数;
[0058]
s34、基于各变量强度特征,通过主成分分析法计算各主成分方差贡献率和累积主成分贡献率,选取累积主成分贡献率≥90%的对应主成分作为有效主成分(在本实施例中,
主成分分析法是一种顶层指标权重计算方法,主成分分析法作为本领域公知方法,在此不再赘述);
[0059]
s35、通过如下公式计算每个有效主成分的权重:
[0060][0061]
其中,σm表示所选取的第m个有效主成分对应的方差贡献率,w_pm表示第m个有效主成分的权重,m表示有效主成分的个数;
[0062]
s36、基于有效主成分权重w_pm以及通过主成分分析法计算得到的相应的有效主成分载荷a
mvar
,通过如下公式计算表征每个事件强度的事件强度特征(如图6示出了本实施例得到的直行事件和转向事件中各事件强度特征分布图):
[0063][0064]
其中,event_idxi表示第i个事件的事件强度特征。
[0065]
在本实施例中,步骤s4中,基于事件强度特征,通过k-means聚类算法对基本驾驶操作事件中的每个事件按照直行事件和转向事件进行事件强度聚类,将强度相似的事件聚为一类,得到事件强度类别(在本实施例中,k-means算法是一种迭代求解的经典聚类算法,在此不再赘述)。依次选定聚类个数为1~10,基于轮廓系数sc和戴维森堡丁指数dbi进行聚类结果的分析,确定最佳聚类数(在本实施例中,轮廓系数sc和戴维森堡丁指数dbi是常用的聚类性能度量内部指标,通过计算类内紧凑度与类间离散度对聚类结果进行评价。轮廓系数sc阈值为[-1,1],数值越接近1,聚类效果越好,而戴维森保定指数dbi数值越小,聚类效果越好。)。如图7示出了直行事件和转向事件的事件强度聚类指标变化图,可以看出,对于直行事件来说,当聚类数为3时聚类效果最好;而对于转向事件来说,当聚类数为2时聚类效果最好。对应于图7的最佳聚类数,图8示出了直行事件和转向事件的事件强度聚类结果示意图。在本实施例中,事件强度特征的统计值包括聚类后得到的直行事件和转向事件中每类事件强度特征的平均值、最大值、最小值和标准差,基于事件强度特征的统计值,对聚类得到的各类事件打事件强度类别标签。具体地,聚类后得到的直行事件和转向事件中每类事件强度特征的平均值、最大值和最小值的变化趋势是一致的,标准差差异不大,聚类后得到的直行事件和转向事件中每类事件强度特征的平均值、最大值和最小值越大,事件强度越强,打标签时为表征高强度的标签;聚类后得到的直行事件和转向事件中每类事件强度特征的平均值、最大值、最小值越小,事件强度越低,打标签时为表征低强度的标签。每类的标准差都是较小的,说明每类事件强度特征分布是相对集中的。在本实施例中,优选地,可以将直行事件和转向事件的各类别标签映射到具有物理意义的类别数值,强度越高映射数值越大(例如,图8中映射的数值:直行事件的事件强度类别包括类别1、类别2和类别3;转向事件的事件强度类别包括类别1和类别2)。
[0066]
在本实施例中,s5步骤基于有效自然驾驶数据获取道路线形,并基于道路线形的变化按照直线路段和曲线路段获取动态时间窗具体通过如下方式实现:依据行驶轨迹半径r确定道路线形,并将道路线形作为确定动态时间窗长度的依据,当行驶轨迹半径r》1000m且持续时间t》4s时为包含直行事件的动态时间窗,当行驶轨迹半径r《1000m且持续时间t》
4s时为包含转向事件的动态时间窗。如图9示出了动态时间窗长度分布直方图,如图10示出了时间窗直行事件和转向事件划分结果示意图。在本实施例中,直线路段为包括直行事件(直行匀速、直行减速、直行加速)的路段,曲线路段为包括转向事件(转向匀速、转向减速、转向加速)的路段。
[0067]
在本实施例中,s5步骤基于动态时间窗内事件强度类别和事件转移特征,构造表征动态时间窗内驾驶风格的已具有事件强度类别标签的事件随时间的变化曲线,如图11所示,示出了直行事件和转向事件的事件强度类别随时间变化图,图中曲线横轴为时间轴,纵轴为该时间点对应的事件强度类别数值。在本实施例中,事件转移特征表示的是当前时刻的当前事件强度类别转移为下一时刻的下一事件强度类别的特征。
[0068]
在本实施例中,步骤s5中,基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的曲线进行聚类,得到各类时间窗曲线(如图12示出了包含直行事件和转向事件的时间窗曲线聚类结果示意图,图12中,类别a、b、c表示基于融合dtw的曲线聚类算法对各动态时间窗的曲线进行聚类后得到的各类时间窗曲线的类型,其反映了聚类后得到的各时间窗对应的驾驶风格,表示聚类结果为类别a、类别b和类别c共3类,即有3类驾驶风格,可保证聚类结果的可解释性与被接受性。)的方法具体如下:
[0069]
1)、将各动态时间窗的曲线记为曲线集合c;
[0070]
2)、基于dtw算法计算曲线集合c中两两曲线之间的距离,选取两两曲线之间的距离最大的两条曲线中的任一曲线,记为曲线a,并设定曲线相似度距离阈值t;
[0071]
3)、将曲线a归入曲线集合c1中,并记曲线集合c=c-c1;
[0072]
4)、计算曲线集合c中各曲线与曲线集合c1的距离,得到最小距离所对应的曲线集合c中的曲线b,并记曲线集合c1’=c1+b;
[0073]
5)、计算曲线集合c1’类内相似度d(c1’),如果d(c1’)》t,则转至步骤2),否则将曲线b归入曲线集合c1,分别记曲线集合c1=c1+b,曲线集合c=c-c1,算法转至步骤4);
[0074]
6)、当算法运行至曲线集合c为空集时,算法终止。
[0075]
在本实施例中,步骤s5中步骤4)的计算方法如下:
[0076]
定义1:曲线l
p
(曲线集合c中的任一曲线)与曲线集合c1(l1,l2,...,lm)的距离定义为曲线l
p
与曲线集合c1中所有曲线两两之间距离的平均值,即,
[0077][0078]
其中,m表示曲线集合c1中曲线数量,lz表示曲线集合c1中第z条曲线,l
p
表示曲线集合c中的任一曲线。
[0079]
在本实施例中,步骤s5中步骤5)的计算方法如下:
[0080]
定义2:曲线集合c1'(l1,l2,...,ln)的类内相似度定义为曲线集合c1'中两两曲线之间的最大距离,即,
[0081][0082]
其中,n表示曲线集合c1'中曲线数量,li表示曲线集合c1'中第i条曲线,lj表示曲线集合c1

中第j条曲线。
[0083]
在本实施例中,步骤s5中,基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的曲线进行聚类,得到各类时间窗曲线的方法按照上述步骤1)-6)逐步
进行,需要注意的是,下一步中出现的术语为上一步处理后的术语,如果上一步未出现该术语,则该术语为上上步处理后的术语,如此以此类推,直至最近出现该术语(例如,术语“曲线集合c”:步骤5)符合d(c1’)>t时,转至步骤2),此时步骤2)中出现曲线集合c,步骤2)的上一步为符合d(c1’)>t的步骤5),其未出现曲线集合c,进而查看步骤5)的上一步步骤4),此时出现术语曲线集合c,而步骤4)未对曲线集合c进行限定,进而查看步骤4)的上一步步骤3),步骤3)对曲线集合c进行了处理,可知步骤5)符合d(c1’)>t时,转至步骤2)时使用的曲线集合c为步骤3)处理后的曲线集合c)。在本实施例中,步骤3)中曲线集合c=c-c1的含义为:步骤3)处理后的曲线集合c表示上一步即步骤2)的曲线集合c中移除曲线集合c1后得到的曲线集合;步骤4)中的曲线集合c1’=c1+b、步骤5)中的曲线集合c1=c1+b和曲线集合c=c-c1的含义可做类似的对应理解。
[0084]
在本实施例中,步骤s5中步骤2)设定的曲线相似度距离阈值t为基于dtw算法计算出的曲线集合c中两两曲线之间的距离集合的百分位数,直线路段动态时间窗的百分位数为87百分位数,曲线路段动态时间窗的百分位数为50百分位数,即直线路段动态时间窗曲线相似度距离阈值t为87百分位数,曲线路段动态时间窗曲线相似度距离阈值t为50百分位数。
[0085]
在本实施例中,步骤s5中,基于事件强度类别和事件转移特征,对各类时间窗曲线打驾驶风格类型标签的方法具体如下:
[0086]
步骤一、通过以下公式计算第z类时间窗曲线的事件转移概率:
[0087][0088]
其中,第z类时间窗曲线表示基于融合dtw的曲线聚类算法对各动态时间窗的所述曲线进行聚类后得到的各类时间窗曲线中的某一类时间窗曲线,θ
t
表示当前事件,θ
t+1
表示下一时刻的事件,evento表示当前时刻对应于s4步骤聚类的事件强度类别,event
l
表示下一时刻对应于s4步骤聚类的事件强度类别,n(θ
t
=evento,θ
t+1
=event
l
)表示某一类时间窗内从evento转移到event
l
这个转移形式的数量,n(θ
t+1
=event
l
)表示t+1时刻为event
l
的数量;
[0089]
步骤二、通过以下公式计算第z类时间窗曲线的事件转移概率香农熵:
[0090][0091]
其中,eventr为第z类时间窗曲线中所涉及的事件强度类别数;
[0092]
步骤三、通过以下公式计算第z类时间窗曲线的转移倾向:
[0093][0094]
其中,o为当前事件强度类别,为转移形式权重,为第z类时间窗曲线各转移形式转移前后事件强度类别跨度差(即,转移前后事件强度类别标签映射的具有物理意义的类别数值之差),o=n(o=n表示o与n的含义相同)且o、n均表示s4
步骤聚类的事件强度类别数,event
z.
为转移后的事件强度类别,为转移前的事件强度类别;
[0095]
步骤四、通过以下公式计算第z类时间窗曲线所包含的所有事件的事件强度平均值,作为第z类时间窗曲线的事件强度特性:
[0096][0097]
其中,s为第z类时间窗曲线中曲线个数,为第s条曲线第t时刻对应的事件强度类别,t为第s条曲线持续的时间长度;
[0098]
步骤五、基于第z类时间窗曲线的事件转移概率香农熵、第z类时间窗曲线的转移倾向和第z类时间窗曲线的事件强度特性的数值大小,对各类时间窗曲线按照数值由小到大依次打谨慎型、正常型和激进型驾驶风格标签。在本实施例中,事件转移概率香农熵、转移倾向和事件强度特性这三个指标皆为正向指标,三个指标的数值越小,表示驾驶风格越谨慎,打谨慎型标签;三个指标的数值越大,表示驾驶风格越激进,打激进型标签;三个指标的数值居中,则表示驾驶风格越正常,打正常型标签。如图13示出了包含直行事件和转向事件的时间窗驾驶风格类别曲线图,可以看出:包含直行事件的时间窗侧向加速度均无明显差异化;而谨慎型和正常型相对于激进型来说,速度都相对较低;谨慎型的纵向加速度没有明显变化,基本维持在零附近,因此谨慎型维持在一个相对较低的速度上匀速行驶;相对于谨慎型,正常型在示例时间范围内,有明显的加速和减速行为,操作更加多样性且操作更频繁;对于激进型,其速度相对较大,而且有明显的纵向加速度变化,因此激进型是更倾向于高强度高难度操作。对于包含转向事件的时间窗,在侧向加速度都大致相同的情况下,可以看出谨慎型转弯速度较小,其在转弯过程前期以较低速度进入弯道并且稍带减速行为,随着转弯过程的推进不断加速直到转弯完成,符合常识认知中谨慎型驾驶人在转弯时先以慢速进入弯道来降低行车风险并随着转弯过程的推进慢慢加速直到完成转弯的驾驶行为特性,驾驶风险刺激性都较低,舒适感较强;而激进型驾驶人在转弯时速度较高,有明显的加减速行为,说明激进型驾驶行为在转弯时仍然保持较强的操作特性,在转弯过程中不断的加速减速并保持较高速度,说明该类驾驶人追求驾驶刺激感,更倾向于随着周围环境的改变而不断的调整自己的驾驶策略,因此此类驾驶行为舒适感较差,而且由于加速度的不断变化,其给人造成的刺激感也较强,与人们常识认知的激进型驾驶风格一致;而正常型以匀速通过弯道,操作既不会太过谨慎小心也不会像激进型一样过于频繁刺激,以一种相对平缓又具有通行效率的驾驶行为操作方式通过弯道,符合人为常识认知。根据图13以及以上分析可知,本实施例对驾驶风格的分析方法得出的结果与实际谨慎型、正常型和激进型驾驶的特点相符,说明本实施例对驾驶风格的分析方法有效且准确性高。
[0099]
以上结合具体实施方式对本发明进行了说明,这些具体实施方式仅仅是示例性的,不能以此限定本发明的保护范围,本领域技术人员在不脱离本发明实质的前提下可以进行各种修改、变化或替换。因此,根据本发明所作的各种等同变化,仍属于本发明所涵盖的范围。

技术特征:
1.一种基于基本驾驶操作事件的无监督驾驶风格分析方法,其特征在于,包括以下步骤:s1、获取自然驾驶数据,并对所述自然驾驶数据进行预处理,得到有效自然驾驶数据;s2、基于所述有效自然驾驶数据,提取基本驾驶操作事件;s3、基于所述有效自然驾驶数据,通过驾驶行为特征对所述基本驾驶操作事件中的每个事件进行特征构造和特征提取,得到表征每个事件强度的事件强度特征;s4、基于所述事件强度特征,通过k-means聚类算法对基本驾驶操作事件中的每个事件按照直行事件和转向事件进行事件强度聚类,并根据事件强度特征的统计值,对聚类得到的各类事件打事件强度类别标签;s5、基于所述有效自然驾驶数据获取道路线形,并基于道路线形的变化按照直线路段和曲线路段获取动态时间窗;基于动态时间窗内事件强度类别和事件转移特征,构造表征动态时间窗内驾驶风格的已具有事件强度类别标签的事件随时间的变化曲线;基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的所述曲线进行聚类,得到各类时间窗曲线;基于事件强度类别和事件转移特征,对各类时间窗曲线打驾驶风格类型标签。2.如权利要求1所述的方法,其特征在于,所述自然驾驶数据包括速度、纵向加速度和侧向加速度,所述预处理包括异常数据剔除和数据平滑处理。3.如权利要求1所述的方法,其特征在于,所述基本驾驶操作事件包括六类驾驶操作事件,所述六类驾驶操作事件为直行加速、直行匀速、直行减速、转向加速、转向匀速和转向减速。4.如权利要求2所述的方法,其特征在于,步骤s2中提取基本驾驶操作事件的方法具体如下:s21、基于速度和侧向加速度,计算行驶轨迹半径:其中r为行驶轨迹半径,v为速度,a
y
为侧向加速度;s22、基于纵向加速度,构造纵向加速度波形;s23、基于行驶轨迹半径、纵向加速度波形的波峰值和/或波谷值提取基本驾驶操作事件。5.如权利要求4所述的方法,其特征在于,通过以下条件提取基本驾驶操作事件:设定行驶轨迹半径阈值为1000m,当行驶轨迹半径r>=1000m时,提取为直行事件;当行驶轨迹半径r<1000m时,提取为转向事件;设定纵向加速度波形波峰值阈值为1.0m/s2,纵向加速度波形波谷值阈值为-1.0m/s2,当纵向加速度波形波峰值>1.0m/s2时,提取为加速事件;当-1.0m/s2≤纵向加速度波形波峰值或波谷值≤1.0m/s2时,提取为匀速事件;当纵向加速度波形波谷值<-1.0m/s2时,提取为减速事件。6.如权利要求1所述的方法,其特征在于,步骤s3中获取表征每个事件强度的事件强度特征的方法具体如下:s31、以有效自然驾驶数据作为变量,基于各变量构造驾驶行为特征,其中,所述驾驶行为特征包括平均值、中位数、切尾均值、标准差、四分位差、绝对中位差、百分位数、最小值、
最大值、香农熵和近似熵;s32、通过熵值法计算各变量的各驾驶行为特征权重;s33、基于各变量的各驾驶行为特征权重,通过以下多项式计算得到各变量强度特征:其中,var_idx
i
表示第i个事件var变量的强度特征,var=[有效自然驾驶数据]=[速度,纵向加速度,侧向加速度],w_s
vark
表示var变量的第k个驾驶行为特征权重,f
ik
为第i个事件var变量的第k个驾驶行为特征,k为各变量驾驶行为特征数;s34、基于各变量强度特征,通过主成分分析法计算各主成分方差贡献率和累积主成分贡献率,选取累积主成分贡献率≥90%的对应主成分作为有效主成分;s35、通过如下公式计算每个有效主成分的权重:其中,σ
m
表示所选取的第m个有效主成分对应的方差贡献率,w_p
m
表示第m个有效主成分的权重,m表示有效主成分的个数;s36、基于有效主成分权重w_p
m
以及通过主成分分析法计算得到的相应的有效主成分载荷a
mvar
,通过如下公式计算表征每个事件强度的事件强度特征:其中,event_idx
i
表示第i个事件的事件强度特征。7.如权利要求1所述的方法,其特征在于,步骤s4中,基于所述事件强度特征,通过k-means聚类算法对基本驾驶操作事件中的每个事件按照直行事件和转向事件进行事件强度聚类后,基于轮廓系数和戴维森堡丁指数判定聚类结果;所述事件强度特征的统计值包括聚类后得到的直行事件和转向事件中每类事件强度特征的平均值、最大值、最小值和标准差,基于所述事件强度特征的统计值,对聚类得到的各类事件打事件强度类别标签。8.如权利要求1所述的方法,其特征在于,步骤s5中,基于融合dtw的曲线聚类算法,按照直行事件和转向事件对各动态时间窗的所述曲线进行聚类,得到各类时间窗曲线的方法具体如下:1)、将各动态时间窗的所述曲线记为曲线集合c;2)、基于dtw算法计算曲线集合c中两两曲线之间的距离,选取两两曲线之间的距离最大的两条曲线中的任一曲线,记为曲线a,并设定曲线相似度距离阈值t;3)、将曲线a归入曲线集合c1中,并记曲线集合c=c-c1;4)、计算曲线集合c中各曲线与曲线集合c1的距离,得到最小距离所对应的曲线集合c中的曲线b,并记曲线集合c1’=c1+b;5)、计算曲线集合c1’类内相似度d(c1’),如果d(c1’)>t,则转至步骤2),否则将曲线b归入曲线集合c1,分别记曲线集合c1=c1+b,曲线集合c=c-c1,算法转至步骤4);6)、当算法运行至曲线集合c为空集时,算法终止。
9.如权利要求8所述的方法,其特征在于,所述曲线相似度距离阈值t为基于dtw算法计算出的曲线集合c中两两曲线之间的距离集合的百分位数,直线路段动态时间窗的百分位数为87百分位数,曲线路段动态时间窗的百分位数为50百分位数。10.如权利要求8所述的方法,其特征在于,步骤s5中,基于事件强度类别和事件转移特征,对各类时间窗曲线打驾驶风格类型标签的方法具体如下:步骤一、通过以下公式计算第z类时间窗曲线的事件转移概率:其中,第z类时间窗曲线表示基于融合dtw的曲线聚类算法对各动态时间窗的所述曲线进行聚类后得到的各类时间窗曲线中的某一类时间窗曲线,θ
t
表示当前事件,θ
t+1
表示下一时刻的事件,event
o
表示当前时刻对应于s4步骤聚类的事件强度类别,event
l
表示下一时刻对应于s4步骤聚类的事件强度类别,n(θ
t
=event
o
,θ
t+1
=event
l
)表示某一类时间窗内从event
o
转移到event
l
这个转移形式的数量,n(θ
t+1
=event
l
)表示t+1时刻为event
l
的数量;步骤二、通过以下公式计算第z类时间窗曲线的事件转移概率香农熵:其中,event
r
为第z类时间窗曲线中所涉及的事件强度类别数;步骤三、通过以下公式计算第z类时间窗曲线的转移倾向:其中,o为当前事件强度类别,为转移形式权重,为第z类时间窗曲线各转移形式转移前后事件强度类别跨度差,o=n且o、n均表示s4步骤聚类的事件强度类别数,event
z.
为转移后的事件强度类别,为转移前的事件强度类别;步骤四、通过以下公式计算第z类时间窗曲线所包含的所有事件的事件强度平均值,作为第z类时间窗曲线的事件强度特性:其中,s为第z类时间窗曲线中曲线个数,为第s条曲线第t时刻对应的事件强度类别,t为第s条曲线持续的时间长度;步骤五、基于第z类时间窗曲线的事件转移概率香农熵、第z类时间窗曲线的转移倾向和第z类时间窗曲线的事件强度特性的数值大小,对各类时间窗曲线按照数值由小到大依次打谨慎型、正常型和激进型驾驶风格标签。

技术总结
本发明提供一种基于基本驾驶操作事件的无监督驾驶风格分析方法,包括:获取数据并预处理;提取基本驾驶操作事件;对基本驾驶操作事件中每个事件进行特征构造和提取,得事件强度特征;通过k-means进行事件强度聚类并打事件强度类别标签;获取动态时间窗,构造表征动态时间窗内驾驶风格的已具有事件强度类别标签的事件随时间变化曲线;基于融合DTW的曲线聚类算法,对各动态时间窗的曲线聚类,得各类时间窗曲线并打驾驶风格类型标签。本发明以基本驾驶操作事件为基本单元,考虑事件强度和事件转移特征,以事件随时间的变化曲线作为描述驾驶风格的特征,体现驾驶行为的动态决策信息、数据连续性和时间特性,保留数据原始信息,提高驾驶风格分析准确性。提高驾驶风格分析准确性。提高驾驶风格分析准确性。


技术研发人员:李显生 崔晓彤 郑雪莲 任园园 赵兰
受保护的技术使用者:吉林大学
技术研发日:2022.02.25
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-2808.html

最新回复(0)