1.本发明属于智能网联汽车领域,具体涉及一种用于智能网联汽车的裁决技术。
背景技术:2.随着汽车技术的快速发展,传统汽车正朝向具有网联化、智能化特征的智能网联汽车演变。智能网联汽车是未来智能交通的核心技术,给人类生活带来了极大便利,例如对车辆进行实时监控、对驾驶员进行交通诱导等。但智能网联汽车自身安全问题也逐渐显现,各类汽车安全事件频发。其安全威胁来自多个方面,既有因车辆自身传感器、数据分析处理缺陷而带有内生安全问题的认知系统,也可能来自针对车辆自身漏洞的网络攻击。由于汽车运行环境的特殊性,在受到网络攻击时驾驶员将失去对汽车的控制权,甚至造成生命或财产损失,开展智能网联汽车数据异常感知、提升内生安全至关重要。如何网络通信、大数据、人工智能等技术敏捷感知智能网联车隐藏的异常与威胁问题,是智能网联车安全研究领域需要攻克的难题。
3.长期以来,针对智能网联汽车状态异常感知的研究主要聚焦在基于先验知识的异常检测方向,重点开展can总线传输数据的内容字段校验、内容格式正确性检查、以及对配置与控制指令数值范围合理性检查等研究及功能实现,此类异常检测方法能够对can总线传输数据的协议类型、数据格式与边界阈值等方面的进行有效检测,在一定程度上提升了智能网联汽车的安全可靠性,但难以检测到那些不依赖先验知识的未知类型异常。近年来,随着大数据、人工智能等技术在通信领域的融合发展,也有部分研究将基于大数据统计的关联分析引入到智能网联汽车状态安全威胁感知领域,这种方法能够通过统计状态发生的频次、以及不同状态间的依赖关系,来预测未知异常发生概率,但对于智能网联汽车海量数据中噪声数据、以及不平衡的异常数据,都难以通过关联分析准确预测出异常结果。此外,还有研究人员将复杂的神经网络算法应用到智能网联汽车状态异常检测中,但这类方法提出的算法模型复杂度高、消耗资源大,无法满足车载终端计算、存储资源有限的约束条件,难以在智能网联汽车控制终端中得到实际部署与应用。
技术实现要素:4.为了解决上述难题,本发明的目的在于一种提供智能网联汽车异常智能检测方法、装置及可读存储介质,效缓解噪声数据和不平衡数据影响威胁感知精度的问题,满足了车载终端有限资源约束条件下的轻量化部署要求。
5.为达到上述发明创造目的,本发明采用如下技术方案:
6.一种智能网联汽车异常智能检测方法,所述检测方法包括:
7.根据根不同车辆数据类型间的关系确定样本特征的数据类型,获取所述样本特征对应的车辆数据,对所述车辆数据预处理后得到用于训练的样本数据;
8.用所述样本数据训练车辆异常检测决策树模型,生成泛化能力达到预设目标的决策树模型;
9.将所述决策树模型部署到车载终端,获取实时车辆数据,得到车辆数据是否异常的结果。
10.进一步的,所述样本数据包含多种不同的样本特征,各类型样本数据之间互不关联。
11.进一步的,用所述样本数据训练决策树模型,生成泛化能力达到预设目标的决策树模型具体过程为:
12.根据信息增益率计算方法得到特征分裂点序,生成车辆异常检测初始决策树模型,采用后剪枝方式对所述初始决策树模型进行精剪,生成优化的决策树模型。
13.进一步的,所述根据信息增益率计算生成初始决策树模型具体为:
14.根据信息增益率计算方法得到特征分裂点序,信息增益率计算函数表示为:
[0015][0016]
其中,info(u)为分裂前的信息熵,infoa(u)表示按特征a分裂后的信息熵,ub是特征a将u划分成n个不同类的样本子集,u为训练数据集;
[0017]
根据所述特征分裂点序,生成车辆异常检测初始决策树模型initree。
[0018]
进一步的,通过后剪枝精剪决策树模型生成优化的决策树模型具体为:
[0019]
通过以下条件确定子树是否需要剪枝:
[0020][0021]
其中,subtree为初始决策树模型initree中的子树,leaf为初始决策树模型initree中的叶子节点,子树e
sub
为子树下各叶子节点误判的数量,α为惩罚因子;f(leaf)=e
leaf
+α,e
leaf
为子树换成叶子后的误判数量。
[0022]
作为本技术的一种优选实施方案,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型。
[0023]
进一步的,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型具体为:
[0024]
将样本u判断错误的代价转化为抽样权重,并反馈到样本数据抽样训练中,定义的融合综合代价的样本数据抽样权重表示为:
[0025][0026]
其中,βi为样本数据在s时刻被机器决策树模型误判的概率,按照样本数据新的权重抽样形成新的训练数据子集,生成泛化能力达到预设目标的决策树模型。
[0027]
进一步的,车辆管理云平台定期更新所述决策树模型。
[0028]
本技术还提供一种智能网联汽车异常智能检测装置,所述检测装置包含:
[0029]
样本数据获取模块,所述样本数据模块根据根不同车辆数据类型间的关系确定样本特征的数据类型,获取所述样本特征对应的车辆数据,对所述车辆数据预处理后得到用于训练的样本数据;
[0030]
决策树模型生成模块,所述决策树模型生成模块用所述样本数据训练车辆异常检测决策树模型,生成泛化能力达到预设目标的决策树模型;
[0031]
车载终端,所述车载终端内设置有所述决策树模型,所述车载终获取实时车辆数据,将其输入所述决策树模型中得到车辆数据是否异常的结果。
[0032]
进一步的,所述样本数据包含多种不同的样本特征,各类型样本数据之间互不关联。
[0033]
进一步的,用所述样本数据训练决策树模型,生成泛化能力达到预设目标的决策树模型具体过程为:
[0034]
根据信息增益率计算方法得到特征分裂点序,生成车辆异常检测初始决策树模型,采用后剪枝方式对所述初始决策树模型进行精剪,生成优化的决策树模型。
[0035]
进一步的,所述根据信息增益率计算生成初始决策树模型具体为:
[0036]
根据信息增益率计算方法得到特征分裂点序,信息增益率计算函数表示为:
[0037][0038]
其中,info(u)为分裂前的信息熵,infoa(u)表示按特征a分裂后的信息熵,ub是特征a将u划分成n个不同类的样本子集,u为训练数据集;
[0039]
根据所述特征分裂点序,生成车辆异常检测初始决策树模型initree。
[0040]
进一步的,通过后剪枝精剪决策树模型生成优化的决策树模型具体为:
[0041]
通过以下条件确定子树是否需要剪枝:
[0042][0043]
其中,subtree为初始决策树模型initree中的子树,leaf为初始决策树模型initree中的叶子节点,子树e
sub
为子树下各叶子节点误判的数量,α为惩罚因子;f(leaf)=e
leaf
+α,e
leaf
为子树换成叶子后的误判数量。
[0044]
作为本技术的一种优选实施方案,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型。
[0045]
进一步的,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型具体为:
[0046]
将样本u判断错误的代价转化为抽样权重,并反馈到样本数据抽样训练中,定义的融合综合代价的样本数据抽样权重表示为:
[0047]
[0048]
其中,βi为样本数据在s时刻被机器决策树模型误判的概率,按照样本数据新的权重抽样形成新的训练数据子集,生成泛化能力达到预设目标的决策树模型。
[0049]
进一步的,所述检测装置从车辆管理云平台定期获取更新的决策树模型。
[0050]
本技术还提供一种计算机可读存储介质,所述存储介质中包含上述一种智能网联汽车异常智能检测方法。
[0051]
本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点:
[0052]
本发明实施例利用大数据和人工智能技术构建了基于数据驱动的智能网联汽车异常智能检测模型,有效解决了传统检测方法依赖先验规则难以感知未知异常的不足;其次,设计了后剪枝方式精剪决策树模型,并综合代价敏感因素优化训练数据,能够有效提升智能网联汽车异常智能检测模型的泛化能力;此外,该方法采用轻量化部署方式只将训练好的智能网联汽车异常智能检测模型部署到车载终端,并通过云平台训练系统周期性更新,能够在车载终端有限资源约束条件下的实现异常检测模型动态更新与优化。
附图说明
[0053]
图1为本发明方法的流程图。
具体实施方式
[0054]
以下结合具体的实施例子对上述方案做进一步说明,本发明的优选实施例详述如下:
[0055]
实施例1
[0056]
参见图1,本发明实施提供一种智能网联汽车异常智能检测方法,该方法包括:
[0057]
1)本发明根据车辆数值型状态量取值范围,建立车辆部分数值型状态量的分段取值映射关系,将数值型的运行状态转换为枚举型取值;通过分析车辆不同状态量间的关联关系,选取合适的状态量作为样本特征;
[0058]
所述车辆部分数值型状态量的分段取值映射关系表示为:
[0059][0060]
例如车速根据实际速度与最高速度的比值区间可以映射出“低速”、“慢速”、“正常”、“快速”“超速”五档枚举型分段值,油料、方向等数值型状态量同样可以映射成枚举型。
[0061]
提出的车辆不同数据类型间的关联关系表示为:
[0062][0063]
其中,pi为车辆的某一类具体信息;p为车辆所有类型的信息集,集合大小为k;a
i,j
为pi与pj的关联系数,当所有的a
i,j
,i,j∈[1,k]且j≠i均为0时,pi为有效特征量,将其保存至φ,φ为最终选定的样本数据特征,由φ中特征构成的样本数据集为u。
[0064]
2)通过合成少数类过采样方式,扩充数量较少的不平衡样本数据。首先通过统计频次找到数量较少的不平衡样本ui,然后找出与其各特征量最相似的n个近邻样本数据。n个近邻样本数据判断的依据是:
[0065][0066]
其中,n(ui,uj)为计算两个样本数据ui和uj之间的近似度,值越小则表示两个样本越相似,ui、uj为样本数据集u中的两个样本数据;表示样本数据ui第t个特征的取值。
[0067]
选定不平衡样本数据的n个临近样本后,获取不平衡样本数据与这n个最近邻样本的特征向量差异,并将差异乘以0和1之间的随机数合成到不平衡样本数据,通过反复合成来扩充不平衡样本数据数量。
[0068]
3)根据信息增益率计算方法得到特征分裂点序,生成车辆异常检测初始决策树模型initree,再通过后剪枝精剪决策树模型,然后综合代价敏感因素优化训练数据,通过迭代训练生成泛化能力较优的决策树模。
[0069]
31)用于生成决策树的信息增益率计算可以表示为:
[0070][0071]
其中,info(u)为分裂前的信息熵,其计算方式为将训练集u划分为m类统计结果,μ
φ
为第φ种分类的概率;infoa(u)表示按特征a分裂后的信息熵,其计算方式为ub是将集合u根据特征a取值而划分成n个不同类的样本子集。
[0072]
32)在决定是否需要对决策树初始模型进行后剪枝时,需要满足以下条件模型:
[0073][0074]
其中,subtree为初始决策树模型initree中的子树,leaf为初始决策树模型initree中的叶子节点,子树e
sub
为子树下各叶子节点误判的数量,α为惩罚因子,取值区间为(0,1);f(leaf)=e
leaf
+α,e
leaf
为子树换成叶子后的误判数量。
[0075]
33)将样本u判断错误的代价转化为抽样权重,并反馈到下一步的样本数据抽样训
练中,定义的融合综合代价的样本数据抽样权重表示为:
[0076][0077]
其中,βi为样本数据在s时刻被机器学习模型误判的概率。按照样本数据新的权重抽样形成新的训练数据子集,反复训练决策树模型,满足迭代次数w后,形成泛化能力较优的强学习器模型。
[0078]
本发明实施例利用大数据和人工智能技术构建了基于数据驱动的智能网联汽车异常智能检测模型,有效解决了传统检测方法依赖先验规则难以感知未知异常的不足;其次,设计了后剪枝方式精剪决策树模型,并综合代价敏感因素优化训练数据,能够有效提升智能网联汽车异常智能检测模型的泛化能力;此外,该方法采用轻量化部署方式只将训练好的智能网联汽车异常智能检测模型部署到车载终端,并通过云平台训练系统周期性更新,能够在车载终端有限资源约束条件下的实现异常检测模型动态更新与优化。
[0079]
实施例2
[0080]
本技术还提供一种智能网联汽车异常智能检测装置,所述检测装置包含:
[0081]
样本数据获取模块,所述样本数据模块根据根不同车辆数据类型间的关系确定样本特征的数据类型,获取所述样本特征对应的车辆数据,对所述车辆数据预处理后得到用于训练的样本数据;
[0082]
决策树模型生成模块,所述决策树模型生成模块用所述样本数据训练车辆异常检测决策树模型,生成泛化能力达到预设目标的决策树模型;
[0083]
车载终端,所述车载终端内设置有所述决策树模型,所述车载终获取实时车辆数据,将其输入所述决策树模型中得到车辆数据是否异常的结果。
[0084]
进一步的,所述样本数据包含多种不同的样本特征,各类型样本数据之间互不关联。
[0085]
进一步的,用所述样本数据训练决策树模型,生成泛化能力达到预设目标的决策树模型具体过程为:
[0086]
根据信息增益率计算方法得到特征分裂点序,生成车辆异常检测初始决策树模型,采用后剪枝方式对所述初始决策树模型进行精剪,生成优化的决策树模型。
[0087]
作为本技术的一种优选实施方案,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型。
[0088]
进一步的,所述检测装置从车辆管理云平台定期获取更新的决策树模型。
[0089]
本发明采用车载终端轻量化安装与云平台定期更新相结合的方式部署。首先将通过大量数据训练生成的异常智能检测装置部署到车载终端,然后车辆管理云平台对来自车辆新的数据进行持续训练,将训练生成的新的检测模型以推送方式更新部署到车载终端,已替换异常智能检测装置中的旧版本机器学习模型,从而提升异常检测模型在车载终端有限资源约束条件下的更新优化能力。
[0090]
实施例3
[0091]
本技术还提供一种计算机可读存储介质,所述存储介质中含有上述智能网联汽车异常智能检测方法。
[0092]
上面对本发明实施例结合附图进行了说明,但本发明不限于上述实施例,还可以根据本发明的发明创造的目的做出多种变化,凡依据本发明技术方案的精神实质和原理下做的改变、修饰、替代、组合或简化,均应为等效的置换方式,只要符合本发明的发明目的,只要不背离本发明的技术原理和发明构思,都属于本发明的保护范围。
技术特征:1.一种智能网联汽车异常智能检测方法,其特征在于,所述检测方法包括:根据根不同车辆数据类型间的关系确定样本特征的数据类型,获取所述样本特征对应的车辆数据,对所述车辆数据预处理后得到用于训练的样本数据;用所述样本数据训练车辆异常检测决策树模型,生成泛化能力达到预设目标的决策树模型;将所述决策树模型部署到车载终端,获取实时车辆数据,得到车辆数据是否异常的结果。2.根据权利要求1所述的一种智能网联汽车异常智能检测方法,其特征在于,所述样本数据包含多种不同的样本特征,各类型样本数据之间互不关联。3.根据权利要求1所述的一种智能网联汽车异常智能检测方法,其特征在于,用所述样本数据训练决策树模型,生成泛化能力达到预设目标的决策树模型具体过程为:根据信息增益率计算方法得到特征分裂点序,生成车辆异常检测初始决策树模型,采用后剪枝方式对所述初始决策树模型进行精剪,生成优化的决策树模型。4.根据权利要求3所述的一种智能网联汽车异常智能检测方法,其特征在于,所述根据信息增益率计算生成初始决策树模型具体为:根据信息增益率计算方法得到特征分裂点序,信息增益率计算函数表示为:其中,info(u)为分裂前的信息熵,info
a
(u)表示按特征a分裂后的信息熵,u
b
是特征a将u划分成n个不同类的样本子集,u为训练数据集;根据所述特征分裂点序,生成车辆异常检测初始决策树模型initree。5.根据权利要求3所述的一种智能网联汽车异常智能检测方法,其特征在于,通过后剪枝精剪决策树模型生成优化的决策树模型具体为:通过以下条件确定子树是否需要剪枝:其中,subtree为初始决策树模型initree中的子树,leaf为初始决策树模型initree中的叶子节点,子树e
sub
为子树下各叶子节点误判的数量,α为惩罚因子;f(leaf)=e
leaf
+α,e
leaf
为子树换成叶子后的误判数量。6.根据权利要求3至5任一项所述的一种智能网联汽车异常智能检测方法,其特征在于,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型。7.根据权利要求6所述的一种智能网联汽车异常智能检测方法,其特征在于,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型具体为:将样本u判断错误的代价转化为抽样权重,并反馈到样本数据抽样训练中,定义的融合综合代价的样本数据抽样权重表示为:
其中,β
i
为样本数据在s时刻被机器决策树模型误判的概率,按照样本数据新的权重抽样形成新的训练数据子集,生成泛化能力达到预设目标的决策树模型。8.根据权利要求5所述的一种智能网联汽车异常智能检测方法,其特征在于,车辆管理云平台定期更新所述决策树模型。9.一种智能网联汽车异常智能检测装置,其特征在于,所述检测装置包含:样本数据获取模块,所述样本数据模块根据根不同车辆数据类型间的关系确定样本特征的数据类型,获取所述样本特征对应的车辆数据,对所述车辆数据预处理后得到用于训练的样本数据;决策树模型生成模块,所述决策树模型生成模块用所述样本数据训练车辆异常检测决策树模型,生成泛化能力达到预设目标的决策树模型;车载终端,所述车载终端内设置有所述决策树模型,所述车载终获取实时车辆数据,将其输入所述决策树模型中得到车辆数据是否异常的结果。10.根据权利要求8所述的一种智能网联汽车异常智能检测装置,其特征在于,所述样本数据包含多种不同的样本特征,各类型样本数据之间互不关联。11.根据权利要求8所述的一种智能网联汽车异常智能检测装置,其特征在于,用所述样本数据训练决策树模型,生成泛化能力达到预设目标的决策树模型具体过程为:根据信息增益率计算方法得到特征分裂点序,生成车辆异常检测初始决策树模型,采用后剪枝方式对所述初始决策树模型进行精剪,生成优化的决策树模型。12.根据权利要求11所述的一种智能网联汽车异常智能检测装置,其特征在于,所述根据信息增益率计算生成初始决策树模型具体为:根据信息增益率计算方法得到特征分裂点序,信息增益率计算函数表示为:其中,info(u)为分裂前的信息熵,info
a
(u)表示按特征a分裂后的信息熵,u
b
是特征a将u划分成n个不同类的样本子集,u为训练数据集;根据所述特征分裂点序,生成车辆异常检测初始决策树模型initree。13.根据权利要求11所述的一种智能网联汽车异常智能检测装置,其特征在于,通过后剪枝精剪决策树模型生成优化的决策树模型具体为:通过以下条件确定子树是否需要剪枝:其中,subtree为初始决策树模型initree中的子树,leaf为初始决策树模型initree中
的叶子节点,子树e
sub
为子树下各叶子节点误判的数量,α为惩罚因子;f(leaf)=e
leaf
+α,e
leaf
为子树换成叶子后的误判数量。14.根据权利要求8至13所述的一种智能网联汽车异常智能检测装置,其特征在于,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型。15.根据权利要求14所述的一种智能网联汽车异常智能检测装置,其特征在于,采用代价敏感因素方法测试所述优化的决策树模型,直到决策树模型误判的概率小于设定值,生成泛化能力达到预设目标的决策树模型具体为:将样本u判断错误的代价转化为抽样权重,并反馈到样本数据抽样训练中,定义的融合综合代价的样本数据抽样权重表示为:其中,β
i
为样本数据在s时刻被机器决策树模型误判的概率,按照样本数据新的权重抽样形成新的训练数据子集,生成泛化能力达到预设目标的决策树模型。16.根据权利要求11所述的一种智能网联汽车异常智能检测装置,其特征在于,所述检测装置从车辆管理云平台定期获取更新的决策树模型。17.一种计算机可读存储介质,其特征在于,所述存储介质中包含如权利要求1至8任一项所述的一种智能网联汽车异常智能检测方法。
技术总结本发明公开了智能网联汽车异常智能检测方法、装置及可读存储介质,所述检测方法包括:根据根不同车辆数据类型间的关系确定样本特征的数据类型,获取所述样本特征对应的车辆数据,对所述车辆数据预处理后得到用于训练的样本数据;用所述样本数据训练车辆异常检测决策树模型,生成泛化能力达到预设目标的决策树模型;将所述决策树模型部署到车载终端,获取实时车辆数据,得到车辆数据是否异常的结果。本发明实施例利用大数据和人工智能技术构建了基于数据驱动的智能网联汽车异常智能检测模型,有效解决了传统检测方法依赖先验规则难以感知未知异常的不足。感知未知异常的不足。感知未知异常的不足。
技术研发人员:张震 张金锋 伊鹏 段通 谢记超 张跃中
受保护的技术使用者:国家数字交换系统工程技术研究中心
技术研发日:2021.12.31
技术公布日:2022/7/5