本发明涉及人脸表情运动单元检测,尤其涉及一种基于面部运动单元的抑郁症检测系统。
背景技术:
1、抑郁症是一种常见的心理健康问题,它会影响人的情绪、思维和行为,抑郁症的主要症状包括持续的情绪低落、兴趣丧失、疲劳、食欲改变以及睡眠问题等。面部运动单元检测是一种重要的计算机视觉技术,它的作用主要是分析和理解人类的表情变化,这项技术基于面部动作编码系统(facs),它将面部的运动划分为不同的单元,每个单元对应特定的肌肉群和相应的表情变化。面部运动单元检测的应用非常广泛,例如,通过检测面部运动单元,我们可以了解一个人的情绪状态,这对于心理学研究和人机交互都非常重要;在公共安全领域,面部运动单元检测可以用来识别可疑行为或者潜在威胁,提高社会安全性;在一些医疗应用中,比如疼痛评估或者精神疾病诊断,面部运动单元检测可以帮助医生更准确地理解和判断患者的病情。
2、因此,非常有必要推进通过识别人脸进行抑郁状态检测的技术,而现有的抑郁症检测系统通常是基于人脸面部的表情识别进行判断是否具有抑郁状态,这种通过识别整张脸的表情图像,而非局部区域的面部运动单元,容易忽略人脸图像面部微表情之间的差异,从而降低抑郁症状态检测的准确性,且仅能对正面规则的人脸图像进行识别检测,人脸图像的识别范围有限。本发明将基于人脸的面部运动单元识别进行抑郁状态检测,通过设计一种新的损失函数算法,扩大人脸图像识别范围,并通过设置au划分规则将mtcnn模型与plfd模型输出的结果编码到au r-cnn模型中,将每张人脸图像视为一组独立的区域,对人脸进行区域划分并获取人脸图像中的关键点,能够做到在更细的粒度上对人脸的局部区域进行神经运动单元的识别,从而达到更高的精度,提高抑郁症检测的准确性。
技术实现思路
1、本发明的目的是为了解决现有的通过识别整张脸的表情图像,而非局部区域的面部运动单元,容易忽略人脸图像面部微表情之间的差异,从而降低抑郁症状态检测的准确性,且仅能对正面规则的人脸图像进行识别检测,人脸图像的识别范围有限的问题,而提出的一种基于面部运动单元的抑郁症检测系统。
2、为了实现上述目的,本发明采用了如下技术方案:
3、一种基于面部运动单元的抑郁症检测系统,包括mtcnn模型、plfd模型、au r-cnn模型与逻辑回归神经网络;
4、所述mtcnn模型包含有p-net模块、r-net模块与o-net模块的三个级联网络,通过三个级联网络完成输入图像的人脸检测工作,标记出人脸区域和人脸关键点定位;
5、所述plfd模型用于识别人脸关键点,包含有算法模块、骨干网络与辅助网络;
6、所述au r-cnn模型用于识别神经运动单元,包含有au划分规则、特征模块与头部模块;
7、所述逻辑回归神经网络用于输出最终数值,判断图片或视频中的人脸是否具有抑郁状态。
8、优选地,所述算法模块包含有损失函数算法,用于解决在深度学习中由几何约束与数据不平衡问题限制的准确性;
9、所述损失函数算法通过整合几何约束与数据不平衡问题,得到一个新颖的损耗设计公式:
10、其中,
11、表示损耗;
12、m表示每个过程中训练图像的个数;
13、n表示预先定义的每个人脸要检测的地标数量;
14、c表示造成数据不平衡的c类样本的数量;
15、表示根据c类样本进行调整的权重参数;
16、θ1、θ2和θ3(k=3)分别表示地面真值与估计的偏航角、俯仰角和滚转角之间的偏差角;
17、表示某一度量,用来度量第m个输入的第n个地标的距离或误差;
18、无论三维姿态或数据不平衡是否影响训练,损失都能通过其距离测量来处理局部变化。
19、优选地,所述骨干网络包含有mobilenet块与多尺度全连接层;
20、所述mobilenet块构建plfd模型的骨干网架,取代传统的卷积操作,将单比例尺特征图扩展为多比例尺特征图,提高处理速度与模型紧凑性,所述多尺度全连接层用于精确定位图像中的地标,扩大接收视野,更好地捕捉人脸的全局结构。
21、优选地,所述辅助网络包含有旋转信息计算,用于解决低质量的角度估计问题;
22、所述旋转信息计算将旋转信息的估计与地标定位解耦,能在不需要正面作为输入的情况下输出目标角度,有效估计旋转信息,进一步规范地标定位,其计算方法如下:
23、s1预定义一张标准脸,并在优势面平面上固定11个地标,作为所有训练脸的参考,其中标准脸为在一堆正面脸上取平均值;
24、s2利用每个人脸对应的11个地标和参考地标来估计旋转矩阵;
25、s3根据旋转矩阵计算欧拉角。
26、优选地,所述p-net模块通过单尺度图片训练,将输出结果还原到原图上,过滤得分低与重叠度高的区域,再通过边框回归进行修正,输出很多张可能存在人脸的区域。
27、优选地,所述r-net模块对输入的人脸区域进行细化选择,舍去大部分的错误输入后再通过边框回归与面部关键点定位器对人脸区域的边框回归和关键点进行定位,通过增加的一个全连接层保留更多的图像特征,最后输出更精确可信的人脸区域。
28、优选地,所述o-net模块集成为一个较为复杂的神经网络,拥有更多的输入特征,能同时进行人脸判别、人脸区域边框回归和人脸特征定位,最终输出人脸区域的左上角坐标和右下角坐标与人脸区域的五个特征点。
29、优选地,所述au划分规则把由mtcnn模型与plfd模型输出的结果编码到区域定义和roi级标签定义中,生成au掩码,将图像分解为一堆与au相关的边界框。
30、优选地,所述特征模块通过输入的人脸图像生成特征图与au面罩。
31、优选地,所述头部模块包含有roi池化层,所述roi池化层将任意矩形的边界框内的特征转换为具有固定空间范围的小特征映射,重点识别每个边界框。
32、与现有技术相比,本发明的有益效果是:
33、本发明提供了一种基于面部运动单元的抑郁症检测系统,设计一种新的损失函数算法,解决在深度学习中由几何约束与数据不平衡问题限制的图片识别准确性问题,扩大人脸图像识别范围,并通过设置au划分规则将mtcnn模型与plfd模型输出的结果编码到aur-cnn模型中,将每张人脸图像视为一组独立的区域,对人脸进行区域划分并获取人脸图像中的关键点,能够做到在更细的粒度上对人脸的局部区域进行神经运动单元的识别,从而达到更高的精度,提高抑郁症检测的准确性。
1.一种基于面部运动单元的抑郁症检测系统,其特征在于:包括mtcnn模型、plfd模型、au r-cnn模型与逻辑回归神经网络;
2.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:
3.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:
4.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:
5.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:所述p-net模块通过单尺度图片训练,将输出结果还原到原图上,过滤得分低与重叠度高的区域,再通过边框回归进行修正,输出很多张可能存在人脸的区域。
6.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:所述r-net模块对输入的人脸区域进行细化选择,舍去大部分的错误输入后再通过边框回归与面部关键点定位器对人脸区域的边框回归和关键点进行定位,通过增加的一个全连接层保留更多的图像特征,最后输出更精确可信的人脸区域。
7.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:所述o-net模块集成为一个较为复杂的神经网络,拥有更多的输入特征,能同时进行人脸判别、人脸区域边框回归和人脸特征定位,最终输出人脸区域的左上角坐标和右下角坐标与人脸区域的五个特征点。
8.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:所述au划分规则把由mtcnn模型与plfd模型输出的结果编码到区域定义和roi级标签定义中,生成au掩码,将图像分解为一堆与au相关的边界框。
9.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:所述特征模块通过输入的人脸图像生成特征图与au面罩。
10.根据权利要求1所述的一种基于面部运动单元的抑郁症检测系统,其特征在于:所述头部模块包含有roi池化层,所述roi池化层将任意矩形的边界框内的特征转换为具有固定空间范围的小特征映射,重点识别每个边界框。