基于改进vit的复杂场景下红外图像人体步态识别方法
技术领域
1.本发明涉及图像识别技术领域,尤其涉及基于改进vit(sd vision transformer)的复杂场景下红外图像人体步态识别方法。
背景技术:2.人体步态识别作为最有潜力的远距离生物特征识别技术之一,可在无需被采集者配合的情况下,利用采集到的低分辨率中远距离步态视频图像识别行人的身份信息,相较人脸、指纹等识别条件相对严格的生物特征识别技术而言,具有无需被识别者配合、无感识别、难以隐藏和伪造等诸多优点,在身份识别领域异军突起。
3.目前,步态识别大多皆是在可见光源条件下,但在可见光强度不足、雨、雪及大雾天气等特殊环境下难以进行有效识别。当前的步态识别算法模型以卷积神经网络(cnn)和循环神经网络(rnn)为主。前者在学习步态特征时对于不同人体位置的姿态特征不加以区分,而是作为一个整体进行特征学习,也未考虑人体的行走过程是一个兼有时间域和空间域的特征集合,导致识别精度较低。后者虽将时间域特征加入进来,用相关系数函数测算步态周期大小,以步态周期组作为数据输入,但仍将人体步态作为整体进行特征学习,识别性能有限。
4.故,当前步态识别领域存在数据集选取过于理想化、算法模型不贴近人类思维习惯、未能有效学习不同位置的姿态特征等缺陷。因此,提出一种基于改进vit的复杂场景下红外图像人体步态识别方法,来解决现有技术存在的困难,是本领域技术人员亟需解决的问题。
技术实现要素:5.有鉴于此,本发明提供了基于改进vit的复杂场景下红外图像人体步态识别方法,其中,改进vit模型为sd vision transformer模型,以解决上述技术问题。
6.为了实现上述目的,本发明采用如下技术方案:
7.基于改进vit的复杂场景下红外图像人体步态识别方法,包括以下步骤:
8.s101.数据预处理步骤:对casiac红外人体步态数据集进行预处理、步态周期组容量估算以及按照步态周期组分割数据,得到测试数据集和训练数据集;
9.s201.异类迁移学习权重准备步骤:将vision transformer模型在imagenet-21k数据集上进行训练,然后将训练所得的各层权重参数进行权重冻结和匹配;
10.s301.模型训练步骤:对构建后的sd vision transformer模型进行初始化,并引入s201得到的权重,加载训练数据集进行模型训练,得到训练好的sd vision transformer模型;
11.s401.模型测试步骤:将测试数据集输入至训练好的sd vision transformer模型中,进行复杂场景下红外人体图像步态识别。
12.可选的,s101.数据预处理具体包括以下步骤:
13.s1011.获取casiac红外步态数据库;
14.s1012.对红外人体图像进行均值模型背景减除法,采用背景减除法来提取人体轮廓特征,将被采集者步态信息居中显示,得到步态图像;
15.s1013.采用零均值归一化交叉相关系数对s1012中的步态图像进行相似性估计,来测算步态周期组的容量;
16.s1014.采用滑动窗口方式划分步态图像,得到步态周期组,将全部步态周期组按一定的分割比例划分为训练数据集和测试数据集。
17.可选的,s1012.的具体内容为:
18.先采用均值背景减除法,先对连续的图像序列中n帧连续红外步态图像的同一位置求取均值,并将得到的像素均值作为背景模型,然后逐一进行差分运算;最后通过阈值比较进行运动目标与背景的分割;之后再通过二值化操作和多余背景剪裁操作将人体步态特征展现出来。
19.可选的,t时刻的背景图像如下式:
[0020][0021]
t时刻提取出的运动目标图像的二值图像如下式:
[0022][0023]
式中,i
t
(i,j)代表t时刻的视频帧,t表示分割阈值,(i,j)代表该帧图像中的各像素位置坐标。
[0024]
可选的,s1013中零均值归一化交叉相关系数的计算公式如下式:
[0025][0026]
式(3)中,(x,y)为图像中的像素位置坐标,f(x,y)是原图像像素值,t(x,y)为模板图像像素值,n为模板中像素(元素)的个数,μf、μ
t
分别为原图像和模板图像的像素均值,σf、σt分别为原图像和模板图像像素标准差。
[0027]
可选的,s301.模型训练包括以下步骤:
[0028]
s3011.初始化构建的sd vision transformer模型,引入s201得到的权重,加载训练数据集,将步态周期组中每一个时刻的图像按顺序输入;
[0029]
s3012.分别将某一时刻图像进行等尺寸分割,将一整张图像,按网格化切割成等尺寸图像块,将分割出的每一个图像块分别重构成一维张量,并加入位置嵌入,位置顺序为从左到右,从上到下;
[0030]
s3013.将这各添加了位置嵌入的一维张量输入多头注意力机制模块,之后再通过特征平均融合模块拟合特征权重;
[0031]
s3014.更新sd vision transformer模型的权重;
[0032]
s3015.判断训练数据集是否加载完毕,若为是,则进入s3016,若为否,则返回s3011中继续加载训练数据集;
[0033]
s3016.得到训练好的sd vision transformer模型。
[0034]
可选的,s401.模型测试包括以下步骤:
[0035]
s4011.将测试数据集按照保留时间域和空间域信息的方式输入至训练好的sd vision transformer模型中,进行时间域及空间域步态特征提取;
[0036]
s4012.将得到的时间域及空间域步态特征进行相似性比对,进行复杂场景下红外人体图像步态识别,得到识别测试结果。
[0037]
经由上述的技术方案可知,与现有技术相比,本发明提供了基于改进vit的复杂场景下红外图像人体步态识别方法:1)将红外视频步态图像作为数据研究背景,利用红外摄像机对人体的成像特点进行步态特征识别,不过分依赖可见光源。在一定程度上解决了可见光源强度不足、雨、雪及大雾天气等特殊环境对步态特征识别效果的影响。
[0038]
2)在步态周期估计方面,摒弃传统的归一化交叉系数及绝对差和方式测算步态周期。采用零均值归一化交叉相关系数作为步态周期估计的依据,该方法对红外步态轮廓特征更为敏感,且计算量适中,是对性能和计算量的折中选择。同时以步态周期组为输入块,保留了步态的时间域特征,使步态模型鲁棒性更强。
[0039]
3)采用独立特征子空间和对称双重注意力机制来拟合步态特征,并采用异类迁移学习方式加速拟合小样本步态数据集:
[0040]
首先,与以往步态cnn和rnn算法模型对步态特征整体学习不同。通过将步态图片网格化分割后,添加对应位置嵌入,再利用独立特征子空间分别学习不同人体位置的姿态特征。这样即使得步态特征学习更加有针对性,又最大程度保留了各部分与整体之间的位置关系。
[0041]
其次,利用对称双重注意力机制拟合步态数据,该方式可对人体姿态密集部分加强注意力效果,并以此来弱化无关特征区域对特征拟合的负面影响,更加拟人化的高效学习步态特征。
[0042]
最后,利用迁移学习来提高特征拟合效率,即使是在小样本步态数据集上,仍能显著减少模型训练的时间。
附图说明
[0043]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0044]
图1为本发明提供的基于改进vit的复杂场景下红外图像人体步态识别方法流程图;
[0045]
图2为本发明提供的s101.数据预处理步骤流程图;
[0046]
图3为本发明提供的s301.模型训练步骤流程图;
[0047]
图4为本发明提供的s401.模型测试步骤流程图;
[0048]
图5为本发明提供的基于改进vit的复杂场景下红外图像人体步态识别方法具体流程图;
[0049]
图6为本发明提供的一种对称双重注意力机制步态模型结构图;
[0050]
图7为不同方式处理的对比结果示意图;
[0051]
图8为本发明提供的基于改进vit的复杂场景下红外图像人体步态识别系统结构
框图。
具体实施方式
[0052]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053]
参照图1和图5所示,本发明公开了基于改进vit的复杂场景下红外图像人体步态识别方法,包括以下步骤:
[0054]
s101.数据预处理步骤:对casiac红外人体步态数据集进行预处理、步态周期组容量估算以及按照步态周期组分割数据,得到测试数据集和训练数据集;
[0055]
s201.异类迁移学习权重准备步骤:将vision transformer模型在imagenet-21k数据集上进行训练,然后将训练所得的各层权重参数进行权重冻结和匹配;
[0056]
s301.模型训练步骤:对构建后的sd vision transformer模型进行初始化,并引入s201得到的权重,加载训练数据集进行模型训练,得到训练好的sd vision transformer模型;
[0057]
s401.模型测试步骤:将测试数据集输入至训练好的sd vision transformer模型中,进行复杂场景下红外人体图像步态识别。
[0058]
进一步的,参照图2所示,s101.数据预处理具体包括以下步骤:
[0059]
s1011.获取casiac红外步态数据库;
[0060]
s1012.对红外人体图像进行均值背景减除法,采用背景减除法来提取人体轮廓特征,将被采集者步态信息居中显示,得到步态图像;
[0061]
s1013.采用零均值归一化交叉相关系数对s1012中的步态图像进行相似性估计,来测算步态周期组的容量;
[0062]
s1014.采用滑动窗口方式划分步态图像,得到步态周期组,将全部步态周期组按一定的分割比例划分为训练数据集和测试数据集。
[0063]
更进一步的,s1012.的具体内容为:
[0064]
先采用均值背景减除法,先对连续的图像序列中n帧连续红外步态图像的同一位置求取均值,并将得到的像素均值作为背景模型,然后逐一进行差分运算;最后通过阈值比较进行运动目标与背景的分割;之后再通过二值化操作和多余背景剪裁操作将人体步态特征展现出来。
[0065]
更进一步的,t时刻的背景图像如下式:
[0066][0067]
t时刻提取出的运动目标图像的二值图像如下式:
[0068][0069]
式中,i
t
(i,j)代表t时刻的视频帧,t表示分割阈值,(i,j)代表该帧图像中的各像素位置坐标。
[0070]
进一步的,s1013中采用零均值归一化交叉相关系数(zero-normalized cross correlation,zncc)来作为步态周期估算依据,即先选定某一人体步态作为行走起始状态,然后再利用zncc函数来依次计算每一张图片与起始状态之间的相关系数,从相关系数的周期性变化规律,可以测算出步态周期的变化规律,然后以周期平均值作为步态周期组容量。
[0071]
其中步态周期的定义是指以某一时刻行走姿态为初始态,之后下一次达到与初始态相关系数最高的时刻,判定为下一周期开始的初始态。因此,将两个初始态之间的图像视为一个步态周期。
[0072]
该处所指步态周期,在实际操作过程中为一个单脚步态周期,即如以左脚迈出为初始态,当计算相关性系数时发现,右脚迈出时刻同左脚迈出时刻零均值归一化交叉相关系数很高,故视为一个单脚步态周期。
[0073]
零均值归一化交叉相关系数的计算公式如下式:
[0074][0075]
式(3)中,(x,y)为图像中的像素位置坐标,f(x,y)是原图像像素值,t(x,y)为模板图像像素值,n为模板中像素(元素)的个数,μf、μ
t
分别为原图像和模板图像的像素均值,σf、σt分别为原图像和模板图像像素标准差。
[0076]
可选的,s1014中按照步态周期组划分数据集,由于步态数据集较少,则采用滑动窗口方式划分步态数据集,以获取更多的步态周期组,从而达成扩充数据集的效果。不再以传统单脚迈起,作为步态周期起始态,使步态周期组划分更加丰富、多样。
[0077]
滑动窗口方式是指,确定一个窗口尺寸,视窗口内部为一个步态周期,随着窗口逐张向后滑动,会得到不同的步态周期组。具体的,在同一被采样者连续步态图像中,每一个时刻的姿态都可能作为步态周期起始态,而将最近一次达到此状态的时刻作为步态周期终止态。注意,滑动窗口方式皆在同一个被采样者的数据中滑动,当窗口滑动到该被采样者数据最后一张时即停止向后滑动,保证步态周期组中皆是同一被采样者的行走姿态,防止有其他被采样者姿态的混入,导致数据浑浊。
[0078]
分割完步态周期组后,将全部步态周期组按照7:3的分割比例划分为训练数据集和测试数据集。
[0079]
可选的,s301.模型训练包括以下步骤:
[0080]
s3011.初始化构建的sd vision transformer模型,引入s201得到的权重,加载训练数据集,将步态周期组中每一个时刻的图像按顺序输入;
[0081]
s3012.分别将某一时刻图像进行等尺寸分割,将一整张图像,按网格化切割成等尺寸图像块,将分割出的每一个图像块分别重构成一维张量,并加入位置嵌入;
[0082]
s3013.将这各添加了位置嵌入的一维张量输入多头注意力机制模块,之后再通过特征平均融合模块拟合特征权重;
[0083]
s3014.更新sd vision transformer模型的权重;
[0084]
s3015.判断训练数据集是否加载完毕,若为是,则进入s3016,若为否,则返回s3011中继续加载训练数据集;
[0085]
s3016.得到训练好的sd vision transformer模型。
[0086]
更进一步的,s301.模型训练的具体内容为:处理过程中,首先将步态周期组中每
一个时刻的图像按顺序输入,这是为保留时空域上的姿态特征。然后分别将某一时刻图像进行等尺寸分割,将一整张图像,按网格化切割成等尺寸图像块,以此来分割出行走过程中不同位置的姿态(如:头部,向前摆臂姿态,向后摆臂姿态,迈腿姿态和收腿姿态等)。然后将分割出的每一个图像块分别重构成一维张量,并加入位置嵌入,这是为了保留空间域上的姿态特征。
[0087]
随后,将这各添加了位置嵌入的一维张量输入多头注意力机制模块,这部分采用对称方式架构,之后再通过特征平均融合模块拟合特征权重,目的是通过增加注意力权重的方式实现,加重模型对姿态特征丰富位置“注意力”的效果。重点是利用独立特征子空间去拟合姿态特征,为每个不同的人体位置都匹配一个特征权重拟合矩阵,使得每个独立特征子空间都专门学习各个时间域上相同空间域的姿态特征,特征拟合更加有针对性,准确率和拟合速度都有显著提升。
[0088]
最后经过mlp层进行处理,汇总各层的信息得出最终的分类结果。
[0089]
注意力机制是指一种仿照人类视觉关注重点,捕获输入信息重点特征的结构。本文构建的是一种缩放的点积注意,通过构建“查询向量(query)”、“值向量(value)”和“键向量(key)”使得网络对不同特征分配不同的注意力,可以用公式(4)、公式(5)、公式(6)表示:
[0090][0091]
x=softmax(f(q,k))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0092]
attention(x,v)=x
×vꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0093]
上式中q、k、v分别为构建的查询向量矩阵、键向量矩阵和值向量矩阵,k
t
为矩阵k的转置,dk指的是k的维度,这里作为缩放因子,以控制该结果的过度影响;公式(4)、公式(5)、公式(6)为缩放点积注意的计算步骤。
[0094]
多头注意力机制是在注意力机制的基础上,进一步完善了自注意力,增强了模型专注于不同位置的能力。在运算过程中的每个位置都会覆盖前一层中的位置,使得模型在学习时并不只是关注当前的输入,其他时刻的输入同样对当前结果产生影响,从而构成了数据之间的时序相关性。然后再将每个注意力通道的值concat连接起来并与wo点积,可由如下公式(7)、公式(8)表示:
[0095][0096]
multihead(q,k,v)=concat(head1,head2,...,headn)woꢀꢀꢀ
(8)
[0097]
上式(7)中,表示当前时刻的head不仅考虑此时刻的q、k、v,其他时刻的权重矩阵会对其施加影响;wo表示将多个head进行连接以后,按照函数输出尺寸规范化。
[0098]
位置嵌入采用positional encoding方式添加,本发明采用定尺寸分割块进行图像分割,下列正弦、余弦两种方式效果相近,皆可使用,本发明选择的是正弦位置嵌入方式,该方法可以更好的适应不同尺寸分割块。如公式(9)所示:
[0099]
[0100]
式中,pos表示token在全局中的位置序列号;i表示维数,取[0,...,d
model
/2],d
model
取512。
[0101]
同时,也可选择余弦位置嵌入方式,如公式(10)所示:
[0102][0103]
进一步的,s401.模型测试包括以下步骤:
[0104]
s4011.将测试数据集按照保留时间域和空间域信息的方式输入至训练好的sd vision transformer模型中,进行时间域及空间域步态特征提取;
[0105]
s4012.将得到的时间域及空间域步态特征进行相似性比对,进行复杂场景下红外人体图像步态识别,得到识别测试结果。
[0106]
进一步的,参照图6所示,本发明公开了一种具体的对称双重注意力机制步态模型结构图:首先将步态周期组中每一时刻的图像按序输入embedding层,再将尺寸为128
×
128像素的步态图像按32
×
32像素的图像块分割,然后将图像块分别重构成一维张量,添加位置嵌入后输入encoderblock中,经过并联的多头注意力模块,对输入的不同人体位置姿态图片(如:手臂、腿等)进行姿态细节特征提取后,通过特征平均融合模块拟合特征权重,再经过layernormalization后进入mlp模块中,最后传入mlp_head块得到分类结果。为防止模型过分拟合小样本数据,在对称的多头注意力模块和mlp模块中采用droppath来代替传统的dropout,随机将网络中的多分支结构随机删除。由于vit是处理带有时序性数据的模型结构,因此,要保持人体行走姿态的顺序性,故将划分好的步态周期组作为模型的数据输入,再将图像按照相应的embedding尺寸切割成多个部分,按照从左到右,从上到下的顺序输入encoder中。采用消融实验思想,设置初始学习率为1
×
10-3
,multi_head attention数量为12个,以adam作为优化器,使用categorical_crossentropy多分类交叉熵损失函数计算loss。
[0107]
进一步的,参照图7所示,引入迁移学习后的sd vision transformer模型的识别效果得到明显提升。
[0108]
参照图8所示,本发明公开了一种基于改进vit的复杂场景下红外图像人体步态识别系统,应用上述的基于改进vit的复杂场景下红外图像人体步态识别方法,包括依次连接的数据预处理模块、异类迁移学习权重准备模块、模型训练模块和模型测试模块;
[0109]
数据预处理模块,用于对casiac红外人体步态数据集进行预处理、步态周期组容量估算以及按照步态周期组分割数据,得到测试数据集和训练数据集;
[0110]
异类迁移学习权重准备模块,用于将vision transformer模型在imagenet-21k数据集上进行训练,然后将训练所得的各层权重参数进行权重冻结和匹配;
[0111]
模型训练模块,用于构建sd vision transformer模型,并引入s201得到的权重,加载训练数据集进行模型训练,得到训练好的sd vision transformer模型;
[0112]
模型测试模块,用于将测试数据集输入至训练好的sd vision transformer模型中,进行复杂场景下红外人体图像步态识别。
[0113]
进一步的,本发明还公开了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行上述的基于改进vit的复杂场景下红外图像人体步态识别方法。
[0114]
更进一步的,具体公开了一种计算机可读存储介质,
[0115]
计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行基于改进vit的复杂场景下红外图像人体步态识别方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;存储介质还可以包括上述种类的存储器的组合。
[0116]
对所公开的实施例的上述说明,按照递进的方式进行,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
技术特征:1.基于改进vit的复杂场景下红外图像人体步态识别方法,其特征在于,包括以下步骤:s101.数据预处理步骤:对casiac红外人体步态数据集进行预处理、步态周期组容量估算以及按照步态周期组分割数据,得到测试数据集和训练数据集;s201.异类迁移学习权重准备步骤:将vision transformer模型利用imagenet-21k数据集进行训练,然后将训练所得的各层权重参数进行权重冻结和匹配;s301.模型训练步骤:对构建后的sd vision transformer模型进行初始化,并引入s201得到的权重,加载训练数据集进行模型训练,得到训练好的sd vision transformer模型;s401.模型测试步骤:将测试数据集输入至训练好的sd vision transformer模型中,进行复杂场景下红外人体图像步态识别。2.根据权利要求1所述的基于改进vit的复杂场景下红外图像人体步态识别方法,其特征在于,s101.数据预处理具体包括以下步骤:s1011.获取casiac红外步态数据库;s1012.对红外人体图像进行均值背景减除法,采用背景减除法来提取人体轮廓特征,将被采集者步态信息居中显示,得到步态图像;s1013.采用零均值归一化交叉相关系数对s1012中的步态图像进行相似性估计,来测算步态周期组的容量;s1014.采用滑动窗口方式划分步态图像,得到步态周期组,将全部步态周期组按一定的分割比例划分为训练数据集和测试数据集。3.根据权利要求2所述的基于改进vit的复杂场景下红外图像人体步态识别方法,其特征在于,s1012.的具体内容为:先采用均值背景减除法,先对连续的图像序列中n帧连续红外步态图像的同一位置求取均值,并将得到的像素均值作为背景模型,然后逐一进行差分运算;最后通过阈值比较进行运动目标与背景的分割;之后再通过二值化操作和多余背景剪裁操作将人体步态特征展现出来。4.根据权利要求3所述的基于改进vit的复杂场景下红外图像人体步态识别方法,其特征在于,t时刻的背景图像如下式:t时刻提取出的运动目标图像的二值图像如下式:式中,i
t
(i,j)代表t时刻的视频帧,t表示分割阈值,(i,j)代表该帧图像中的各像素位置坐标。5.根据权利要求2所述的基于改进vit的复杂场景下红外图像人体步态识别方法,其特
征在于,s1013中零均值归一化交叉相关系数的计算公式如下式:式(3)中,(x,y)为图像中的像素位置坐标,f(x,y)是原图像像素值,t(x,y)为模板图像像素值,n为模板中像素(元素)的个数,μ
f
、μ
t
分别为原图像和模板图像的像素均值,σf、σt分别为原图像和模板图像像素标准差。6.根据权利要求1所述的基于改进vit的复杂场景下红外图像人体步态识别方法,其特征在于,s301.模型训练包括以下步骤:s3011.初始化构建的sd vision transformer模型,引入s201得到的权重,加载训练数据集,将步态周期组中每一个时刻的图像按顺序输入;s3012.分别将某一时刻图像进行等尺寸分割,将一整张图像,按网格化切割成等尺寸图像块,将分割出的每一个图像块分别重构成一维张量,并加入位置嵌入,位置顺序为从左到右,从上到下;s3013.将添加了位置嵌入的一维张量输入多头注意力机制模块,之后再通过特征平均融合模块拟合特征权重;s3014.更新sd vision transformer模型的权重;s3015.判断训练数据集是否加载完毕,若为是,则进入s3016,若为否,则返回s3011中继续加载训练数据集;s3016.得到训练好的sd vision transformer模型。7.根据权利要求1所述的基于改进vit的复杂场景下红外图像人体步态识别方法,其特征在于,s401.模型测试包括以下步骤:s4011.将测试数据集按照保留时间域和空间域信息的方式输入至训练好的sd vision transformer模型中,进行时间域及空间域步态特征提取;s4012.将得到的时间域及空间域步态特征进行相似性比对,进行复杂场景下红外人体图像步态识别,得到识别测试结果。
技术总结本发明公开了基于改进ViT的复杂场景下红外图像人体步态识别方法,涉及图像识别技术领域,包括:数据预处理步骤、异类迁移学习权重准备步骤、模型训练步骤、模型测试步骤。本发明能够对复杂场景下红外人体图像步态进行识别,能够解决雨、雪、雾或可见光源不足等因素对步态识别的影响。识别的影响。识别的影响。
技术研发人员:云利军 杨彦辰 陈载清 程飞燕 李若愚
受保护的技术使用者:云南师范大学
技术研发日:2022.04.22
技术公布日:2022/7/5