一种身份识别处理方法和装置与流程

allin2023-04-13 220

1.本发明涉及人工智能领域中的生物特征识别技术领域，尤其涉及一种身份识别处理方法和装置。

背景技术：

2.用户身份识别验证广泛应用于人们日常生活的方方面面，传统用户身份识别验证采用短信验证码或者人脸识别技术：系统首先向用户手机发送一个短信验证码，用户收到验证码后在客户端输入，通过后再进行人脸识别，客户端收集到人脸信息后传到系统后端进行比对，最后系统后端将结果返回给客户端，如果通过则继续后续流程。
3.但随着破解技术的提高，传统技术面临着被破解的风险，改进方法是增加用户验证的流程，如用户根据系统提示(如眨眼、摇头)做出相应动作，增加了用户使用的复杂度，且实际使用中由于用户环境条件限制(如信号强度弱，环境光线差等)，造成验证通过率较低。

技术实现要素：

4.有鉴于此，本发明实施例提供一种身份识别处理方法和装置，至少能够解决现有用户身份识别验证流程复杂且成功率低的现象。
5.为实现上述目的，根据本发明实施例的一个方面，提供了一种应用于服务端的身份识别处理方法，包括：
6.接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端，以接收客户端采集的音视频信息；其中，音视频信息包括用户读所述随机密钥口令的音频信息和视频信息；
7.将所述音频信息转译为文本信息，响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；
8.响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端。
9.可选的，所述将所述音频信息转译为文本信息，包括：
10.计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
11.响应于所述差值大于预设口令有效期，确定所述音视频信息已失效，将识别结果为失败返回给客户端；或
12.响应于所述差值小于或等于所述预设口令有效期，将所述音频信息转译为文本信息。
13.可选的，所述视频信息中提取用户面部特征进行人脸识别操作，包括：
14.计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
15.响应于所述差值大于预设口令有效期，确定所述随机密钥口令已失效，将识别结果为失败返回给客户端；或
16.响应于所述差值小于或等于所述预设口令有效期，从所述视频信息中提取用户面部特征进行人脸识别操作。
17.可选的，所述生成随机密钥口令并返回给客户端，还包括：
18.从所述身份识别请求中获取用户账号，基于与所述用户账号对应的用户信息，将生成的所述随机密钥口令返回给用户。
19.可选的，所述用户信息包括手机号或邮箱地址。
20.可选的，还包括：响应于从所述音频信息中提取用户声音特征为失败，生成更换环境信息并返回给客户端。
21.为实现上述目的，根据本发明实施例的一个方面，提供了一种应用于客户端的身份识别处理方法，包括：
22.响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求，以接收服务端返回的随机密钥口令并显示；
23.调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；
24.将所述音视频信息传输给服务端，使得服务端基于所述音视频信息进行身份识别操作，基于服务端返回的处理结果进行相应操作。
25.可选的，在所述分别采集用户读所述随机密钥口令的音频信息和视频信息之前，还包括：
26.调用声音采集设备采集当前噪音分贝参数，响应于所述当前噪音分贝参数超出预设噪音分贝范围，弹出提示更换环境信息；和/或
27.调用图像采集设备采集当前用户人脸信息，响应于当前用户人脸信息超出屏幕范围、或小于预设大小，弹出调整距离信息。
28.可选的，处理结果包括识别成功、识别失败、更换环境信息中的一种。
29.为实现上述目的，根据本发明实施例的另一方面，提供了一种应用于服务端的身份识别处理装置，包括：
30.密钥口令模块，用于接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端；
31.用户生物特征识别模块，用于接收客户端采集的音视频信息；其中，音视频信息包括用户读所述随机密钥口令的音频信息和视频信息；
32.将所述音频信息转译为文本信息，响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；
33.响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端。
34.可选的，所述密钥口令模块，用于：
35.计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
36.响应于所述差值大于预设口令有效期，确定所述音视频信息已失效，将识别结果为失败返回给客户端；或
37.响应于所述差值小于或等于所述预设口令有效期，将所述音频信息转译为文本信息。
38.可选的，所述密钥口令模块，用于：
39.计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
40.响应于所述差值大于预设口令有效期，确定所述随机密钥口令已失效，将识别结果为失败返回给客户端；或
41.响应于所述差值小于或等于所述预设口令有效期，从所述视频信息中提取用户面部特征进行人脸识别操作。
42.可选的，所述密钥口令模块，还用于：
43.从所述身份识别请求中获取用户账号，基于与所述用户账号对应的用户信息，将生成的所述随机密钥口令返回给用户。
44.可选的，所述用户信息包括手机号或邮箱地址。
45.可选的，所述用户生物特征识别模块，还用于：
46.响应于从所述音频信息中提取用户声音特征为失败，生成更换环境信息并返回给客户端。
47.为实现上述目的，根据本发明实施例的另一方面，提供了一种应用于客户端的身份识别处理装置，包括：
48.请求发送模块，用于响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求，以接收服务端返回的随机密钥口令并显示；
49.信息采集模块，用于调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；
50.信息传输模块，用于将所述音视频信息传输给服务端，使得服务端基于所述音视频信息进行身份识别操作，基于服务端返回的处理结果进行相应操作。
51.可选的，所述信息采集模块，还用于：
52.调用声音采集设备采集当前噪音分贝参数，响应于所述当前噪音分贝参数超出预设噪音分贝范围，弹出提示更换环境信息；和/或
53.调用图像采集设备采集当前用户人脸信息，响应于当前用户人脸信息超出屏幕范围、或小于预设大小，弹出调整距离信息。
54.可选的，处理结果包括识别成功、识别失败、更换环境信息中的一种。
55.为实现上述目的，根据本发明实施例的再一方面，提供了一种身份识别处理电子设备。
56.本发明实施例的电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述任一所述的身份识别处理方法。
57.为实现上述目的，根据本发明实施例的再一方面，提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现上述任一所述的身份识别处理方法。
58.为实现上述目的，根据本发明实施例的又一个方面，提供了一种计算程序产品。本
发明实施例的一种计算程序产品，包括计算机程序，所述程序被处理器执行时实现本发明实施例提供的身份识别处理方法。
59.根据本发明所述提供的方案，上述发明中的一个实施例具有如下优点或有益效果：考虑随机密钥口令、用户面部特征和用户声音特征，且用户面部特征包括静态面部特征和动态面部特征，只要其中一个特征验证通过即可，以提高用户身份识别安全性，避免正常用户反复验证失败的情况。
60.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
61.附图用于更好地理解本发明，不构成对本发明的不当限定。其中：
62.图1是根据本发明实施例的一种应用于服务端的身份识别处理方法的主要流程示意图；
63.图2是根据本发明实施例的一种应用于客户端的身份识别处理方法的流程示意图；
64.图3是根据本发明实施例的一具体地身份识别处理方法的流程示意图；
65.图4是根据本发明实施例的一种应用于服务端的身份识别处理装置的主要模块示意图；
66.图5是根据本发明实施例的一种应用于客户端的身份识别处理装置的主要模块示意图；
67.图6是本发明实施例可以应用于其中的示例性系统架构图；
68.图7是适于用来实现本发明实施例的移动设备或服务器的计算机系统的结构示意图。
具体实施方式
69.以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
70.需要指出的是，在不冲突的情况下，本发明中的实施例以及实施例中的特征可以互相组合。本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
71.用户身份识别验证可广泛适用于需要实名验证的场景，如门禁卡、穿戴设备、管理员、线上贷款、支用、还款、结清等。以线上申请贷款为例，近年来为了方便企业、个人用户申请贷款，扩大受益用户数量，提高贷款申请效率，减少非必要的人力成本，使符合办理条件的用户随时随地都能贷到款，贷款业务逐渐向线上转型。贷款申请业务由于涉及较大资金往来，给了攻击者巨大的利益诱惑，企图寻找系统漏洞进行破解，因而用户身份识别验证是线上办理贷款业务的关键点。
72.现有身份识别认证流程主要存在两方面的缺点：一是验证流程过于简单，如只进
行简单的面部识别，如果验证者的面部信息已被泄露，攻击者仅使用一张照片即可攻破系统，影响系统安全性；另外一个是验证流程复杂且通过率较低，通常是先进行验证码验证，通过后再进行人脸识别，虽增加了攻击者破解系统的难度，但实际使用中由于用户环境条件限制导致验证通过率较低，影响了用户体验。
73.参见图1，示出的是本发明实施例提供的一种应用于服务端的身份识别处理方法的主要流程图，包括如下步骤：
74.s101：接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端，以接收客户端采集的音视频信息；其中，音视频信息包括用户读所述随机密钥口令的音频信息和视频信息；
75.s102：将所述音频信息转译为文本信息，响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；
76.s103：响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端。
77.上述实施方式中，对于步骤s101，生物特征识别采用诸如人脸、指纹、掌纹等人体固有特征进行身份识别，具有不会遗忘、丢失和很难被仿冒等优点，因此可以达到更安全的身份认证目的，其中人脸识别是最普遍采用的身份认证手段。
78.本方案除了考虑人脸识别技术外，还考虑有密钥口令身份识别技术。密钥口令属于基于知识的身份识别的一种，基于知识的身份识别包括但不限于密码、口令等认证手段，该方法存在的主要缺陷在于密码、口令等认证手段容易被忘记。由此，本方案考虑在身份识别阶段，优选生成随机密钥口令方式，以解决上述因固定密码、固定口令遗忘导致验证难的问题。
79.本方案主要涉及两个端，一个是身份识别系统(即服务端)，包括密钥口令模块、用户生物特征识别模块；另一个是用户操作的客户端，该客户端的数量可以是一个或多个，以贷款为例，若用户手机安装线上贷款app(appapplication，应用程序)，则用户既可以在手机 app上申请贷款，也可以使用手机接收身份识别系统传输的密钥口令；但若用户手机未安装该app，除了客户端外还需配置用户终端，例如用户使用自己的电脑或银行自助电脑操作申请贷款，使用手机接收身份识别系统传输的密钥口令。为方便描述，本方案考虑以客户端数量为一个进行说明。
80.身份识别验证平台在收到客户端传输的身份识别请求后，首先调用密钥口令模块，随机生成一段密钥口令并返回给客户端。为便于用户读取，口令长度通常较短，可以是几个数字或字母的组合，如6368、 lylj等一些随机数，并且每次发送的口令都是不同的，以降低信息被盗窃的风险。
81.另外，身份识别请求中通常携带有用户账号，如登陆线上贷款app 的账号，因而身份识别系统可以基于该用户账号获取到用户信息，如用户预留的手机号或邮箱地址，以通过用户信息将生成的随机密钥口令返给用户。但由于用户通常在手机上操作，从方便性和时效性考虑，手机号相对于邮箱使用较为方便，且目前用户注册时通常需要输入手机号，因此用户信息优选手机号。
82.对于步骤s102，身份识别系统在收到客户端采集的音视频信息后，首先调用声音识别程序，将用户朗读的音频信息转译为文本信息，再判断该文本信息中的密钥口令是否等于传输给客户端的密钥口令，若判断结果为不等，则提示用户口令错误，请重新进行身份识别验证。若判断结果为等于、或文本信息中存在该密钥口令，即表示可进行下一流程。
83.实际操作中，客户端在录制音频信息和视频信息时，会调用环境监测设备采集用户所处周围环境的参数，以监测该环境参数是否超出预设环境参数范围，如光线强度是否过高、噪音分贝是否过高、用户离屏幕距离是否过大，若超出则弹出提示换环境信息，以提示用户在环境好的地方录制。因而实际客户端传输给身份识别系统的音视频信息都是质量符合要求的，转译出错概率较低。如果确实转译存在错误了，需提示用户重新录制一遍。
84.进一步的，可以给密钥口令设置有效期，一般为3分钟，超过这个期限即表示密钥口令已被泄露。通过为随机密钥口令设置有效期，有效降低用户贷款信息被泄露的风险。针对密钥口令是否已失效，可以在不同阶段进行：
85.实施例一：
86.s1：计算接收音视频信息的时间和发送随机密钥口令的时间的差值；
87.s2：响应于所述差值大于预设口令有效期，确定所述音视频信息已失效，将识别结果为失败返回给客户端；或
88.s3：响应于所述差值小于或等于所述预设口令有效期，将所述音频信息转译为文本信息。
89.在密钥口令失效的情况下，音视频信息也为失效，因而本实施例主要应用在转译文本之前，若判断出音视频信息失效，则无需继续后续步骤，直接触发重新识别身份流程，否则继续后续转译文本操作。
90.实施例二：
91.s1：计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
92.s2：响应于所述差值大于预设口令有效期，确定所述随机密钥口令已失效，将识别结果为失败返回给客户端；或
93.s3：响应于所述差值小于或等于所述预设口令有效期，从所述视频信息中提取用户面部特征进行人脸识别操作。
94.在出现网络异常的情况下，如用户在客户端点击多次身份识别申请，服务端由于网络故障发送多个密钥口令给客户端；其中，服务端在给具体某一个客户端发送新的密钥口令时，相应前一个密钥口令自动视为失效。
95.具体判断某一密钥口令是否失效，是在以确定音视频信息中包含正确的密钥口令的前提下，再继续后续判断是否失效操作，且此时比对的是最新密钥口令和相应音视频信息的时间差。若已失效，无需继续后续步骤，直接触发重新识别身份流程，否则继续人脸识别操作。
96.用户生物特征识别模块从动态人脸信息中提取用户面部信息，调用第三方人脸数据库保存的用户面部特征对其进行比对。如果比对结果为不通过，提示用户面部识别不通过；如果比对通过，则提示用户身份识别验证成功，可以继续后续操作，如申请贷款后续步骤。本方案中，用户面部特征包括静态面部特征和动态面部特征，音视频信息可以分为多帧图片，从其中多帧或全部图片中提取用户面部特征，即为每帧图片的静态用户面部特征，但
这些特征根据时间轴贯穿，即为动态面部特征。针对验证者的面部信息已经泄露的情况，通过静态面部特征和动态面部特征的比对方式，有效攻击者仅用静态照片攻击系统，极大地增加了攻击难度。
97.对于步骤s103，但若因为用户环境光线差等原因，导致无法提取视频信息中的用户面部特征，或者用户人脸失败的情况，则需考虑使用用户声音特征。用户在注册账号时需录入一段音频信息，用户生物特征识别模块从该音频信息中提取目标用户声音特征，并存入用户生物特征识别模块的数据库中。
98.用户生物特征识别模块从音频信息中提取目标用户声音特征，将该目标用户声音特征与数据库中保存的用户声音特征进行比对，如果比对结果不通过，则提示用户声音识别不通过；如果比对通过，则提示用户身份验证成功，可以进行后续步骤。但如果因为用户环境噪声大的原因无法提取音频信息中的声音特征，则提示用户环境干扰大，请换一个光线好或者安静一点的地方重新进行身份验证。
99.此外，也可以优先对音视频信息进行检测，在用户检测环境光线差的情况下采用声音特征检测，在检测到环境噪声干扰大的情况下采用人脸识别，以此提高了身份验证的成功率。
100.上述实施例所提供的方法，考虑随机密钥口令、用户面部特征和用户声音特征，且用户面部特征包括静态面部特征和动态面部特征，只要其中一个特征验证通过即可，以提高用户身份识别安全性，避免正常用户反复验证失败的情况。
101.参见图2，示出了根据本发明实施例的一种应用于客户端的身份识别处理方法流程示意图，包括如下步骤：
102.s201：响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求，以接收服务端返回的随机密钥口令并显示；
103.s202：调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；
104.s203：将所述音视频信息传输给服务端，使得服务端基于所述音视频信息进行身份识别操作，基于服务端返回的处理结果进行相应操作。
105.上述实施方式中，对于步骤s201，用户操作客户端进入需验证身份的界面，如验证是否为管理员本人的界面、验证是否为业主本人的界面等，客户端在监测到用户进入身份识别验证流程后，自动向身份识别系统发生身份识别请求。以贷款为例，用户登陆手机银行进入相应贷款申请界面，在阅读相关合同、授权银行查询个人征信，且用户点击授权同意之后，才触发身份识别验证流程。
106.对于步骤s202，客户端在收到身份识别系统返回的随机密钥口令后进行显示，以供用户查看。以手机为例，在收到服务端通过短信方式发送的密钥口令后进行显示，用户查看后退出短信功能界面或缩小化短信功能界面，并点击身份识别界面中的开始识别按钮或确认按钮，以继续后续操作，具体的，采集视频信息和音频信息操作。
107.实际操作中，各种不同的生物特征有不同的优缺点，因而可以应用于不同的应用场合，其中人脸是人类最普遍采用的身份验证手段，具有采集简易、方便且隐蔽的优点，但是受光线等环境影响较大。因此客户端在录制视频信息前，可以调用图像采集设备采集当前用户人脸信息，若采集到用户人脸超出屏幕尺寸或者过小(即小于预设大小)，也会弹出
提示信息，以提示用户调整自己与图像采集设备的距离。也可以采集光线强度信息，若光线强度过高，则提示用户更换环境。
108.另外，客户端在录制音频信息前，也可以会调用声音采集设备采集当前噪音分贝参数，以检测噪音分布参数是否超出预设噪音分贝范围。如噪声级为30～40分贝是比较安静的正常环境，超过50分贝就会影响睡眠和休息，70分贝以上干扰谈话，若在当前环境噪音参数超出65(实际可调)即表示当前环境噪音太大，弹出提示换环境信息，以提示用户在环境好的地方录制。
109.客户端调用图像采集设备，通常为安装在客户端上的前置摄像头，采集用户对着前置摄像头朗读收到的密钥口令的视频信息。与此同时，也需要调用声音采集设备，如麦克风，采集用户朗读密钥口令的音频信息。基于视频信息和音频信息生成音视频信息并发给服务端。此时密钥口令可以以悬浮框的形式显示在摄像头界面，以便用户查看，避免用户忘记密钥口令导致的短信界面和摄像头界面来回切换操作。
110.进一步的，考虑普通话的普及型，因此用户可以使用标准普通话朗读密钥口令。但对于年长者或者带有地方口音的用户而言，普通话可能不标准，导致音频识别结果为失败，由此，密钥口令模块可以收录普通话、地方性方言等多种语言，以提高音频识别的准确性和普适性。
111.对于步骤s203，客户端将生成的音视频信息传输给身份识别系统，使得身份识别系统对其进行身份识别处理，得到最终处理结果，包括识别成功、识别失败、更换环境信息、重新识别身份中的一种，以提示用户是否可以继续进行后续操作。对于识别成功，用户可以点击确认继续下一步操作，如申请贷款；对于识别失败，用户可以根据实际需求判断是否需要重新验证身份，如重新点击身份识别页面进行身份验证，或者退出；对于更换环境信息，用户需根据实际调整位置，以使得光线、噪音等均符合采集要求，以提高识别概率。
112.上述实施例所提供的方法，在采集音视频信息之前，优先对用户所处环境光线、噪音分贝等进行监测，若不符合要求则提示用户更换环境，以此保证传输给服务端的音视频信息可用，避免身份验证需多次采集音视频信息的问题。
113.参见图3，示出了根据本发明实施例的一具体地身份识别处理方法流程示意图，包括如下步骤：
114.s301：客户端响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求；
115.s302：服务端接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端；
116.s303：客户端调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；
117.s304：服务端接收客户端采集的音视频信息，将所述音频信息转译为文本信息；
118.s305：响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；
119.s306：响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端；
120.s307：客户端基于服务端返回的处理结果进行相应操作。
121.本发明提供的方法相对于现有技术至少存在如下有益效果：
122.1、考虑随机密钥口令、用户面部特征和用户声音特征，只要其中一个特征验证通过即可，以提高用户身份识别安全性，避免正常用户反复验证失败的情况；
123.2、优先进行密钥口令验证，若验证失败则无需后续流程，验证流程简单，不会占用服务端过多资源；且每次发送的密钥口令均不相同，在新发一个密钥口令时自动将前一个密钥口令设为已失效，能够有效防止攻击者的重放攻击。
124.3、针对验证者面部信息已泄露的情况，本方案中用户面部特征包括动态面部特征和静态面部特征，使得攻击者不能采用验证者照片、预先录制的被攻击者的视频攻击服务端，且不会增加用户操作的复杂度。
125.参见图4，示出了本发明实施例提供的一种应用于服务端身份识别处理装置400的主要模块示意图，包括：
126.密钥口令模块401，提供密钥口令生成、密钥口令有效期判断、以及密钥口令发送功能，具体地接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端；以及从所述身份识别请求中获取用户账号，基于与所述用户账号对应的用户信息，将生成的所述随机密钥口令返回给用户；其中，所述用户信息包括手机号或邮箱地址。
127.用户生物特征识别模块402，又可分为声音特征识别模块和面部特征识别模块。声音特征识别模块提供音频信息转译文本信息功能，以及提取用户声音特征，与数据库保存的目标用户声音特征进行比对，判断是否是该用户。面部特征识别系统使用活体人脸检测这种方式，实现从视频信息提取用户面部特征，与数据库保存的用户面部特征进行比对，验证是否是该用户。
128.具体地：接收客户端采集的音视频信息；其中，音视频信息包括用户读所述随机密钥口令的音频信息和视频信息；
129.将所述音频信息转译为文本信息，响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；
130.响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端；以及
131.响应于从所述音频信息中提取用户声音特征为失败，生成更换环境信息并返回给客户端。
132.本发明实施装置中，所述密钥口令模块401，用于：
133.计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
134.响应于所述差值大于预设口令有效期，确定所述音视频信息已失效，将识别结果为失败返回给客户端；或
135.响应于所述差值小于或等于所述预设口令有效期，将所述音频信息转译为文本信息。
136.本发明实施装置中，所述密钥口令模块401，用于：
137.计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；
138.响应于所述差值大于预设口令有效期，确定所述随机密钥口令已失效，将识别结果为失败返回给客户端；或
139.响应于所述差值小于或等于所述预设口令有效期，从所述视频信息中提取用户面部特征进行人脸识别操作。
140.参见图5，示出了本发明实施例提供的一种应用于客户端身份识别处理装置500的主要模块示意图，包括：
141.请求发送模块501，用于响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求，以接收服务端返回的随机密钥口令并显示；
142.信息采集模块502，用于调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；
143.信息传输模块503，用于将所述音视频信息传输给服务端，使得服务端基于所述音视频信息进行身份识别操作，基于服务端返回的处理结果进行相应操作；其中，处理结果包括识别成功、识别失败、更换环境信息中的一种。
144.本发明实施装置中，所述信息采集模块502，还用于：
145.调用声音采集设备采集当前噪音分贝参数，响应于所述当前噪音分贝参数超出预设噪音分贝范围，弹出提示更换环境信息；和/或
146.调用图像采集设备采集当前用户人脸信息，响应于当前用户人脸信息超出屏幕范围、或小于预设大小，弹出调整距离信息。
147.另外，在本发明实施例中所述装置的具体实施内容，在上面所述方法中已经详细说明了，故在此重复内容不再说明。
148.图6示出了可以应用本发明实施例的示例性系统架构600，包括终端设备601、602、603，网络604和服务器605(仅仅是示例)。
149.终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备，安装有各种通讯客户端应用，用户可以使用终端设备 601、602、603通过网络604与服务器605交互，以接收或发送消息等。
150.网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
151.服务器605可以是提供各种服务的服务器，需要说明的是，本发明实施例所提供的方法一般由服务器605执行，相应地，装置一般设置于服务器605中。包括密钥口令模块和用户生物特征识别模块，密钥口令模块提供密钥口令生成、密钥口令有效期判断、以及密钥口令发送功能。用户生物特征识别模块又可分为声音特征识别模块和面部特征识别模块。声音特征识别模块提供音频信息转译文本信息功能，以及提取用户声音特征，与数据库保存的目标用户声音特征进行比对，判断是否是该用户。面部特征识别系统使用活体人脸检测这种方式，实现从视频信息提取用户面部特征，与数据库保存的用户面部特征进行比对，验证是否是该用户。
152.应该理解，图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
153.下面参考图7，其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范
围带来任何限制。
154.如图7所示，计算机系统700包括中央处理单元(cpu)701，其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708 加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中，还存储有系统700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/ 输出(i/o)接口705也连接至总线704。
155.以下部件连接至i/o接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。
156.特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元 (cpu)701执行时，执行本发明的系统中限定的上述功能。
157.需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。
158.附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要
注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
159.描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括密钥口令模块、用户生物特征识别模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，密钥口令模块还可以被描述为“密钥口令管理模块”。
160.作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备执行上述任一所述的身份识别处理方法。
161.本发明的计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本发明实施例中的身份识别处理方法。
162.上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

技术特征：
1.一种身份识别处理方法，应用于服务端，其特征在于，包括：接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端，以接收客户端采集的音视频信息；其中，音视频信息包括用户读所述随机密钥口令的音频信息和视频信息；将所述音频信息转译为文本信息，响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端。2.根据权利要求1所述的方法，其特征在于，所述将所述音频信息转译为文本信息，包括：计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；响应于所述差值大于预设口令有效期，确定所述音视频信息已失效，将识别结果为失败返回给客户端；或响应于所述差值小于或等于所述预设口令有效期，将所述音频信息转译为文本信息。3.根据权利要求1所述的方法，其特征在于，所述视频信息中提取用户面部特征进行人脸识别操作，包括：计算接收所述音视频信息的时间和发送所述随机密钥口令的时间的差值；响应于所述差值大于预设口令有效期，确定所述随机密钥口令已失效，将识别结果为失败返回给客户端；或响应于所述差值小于或等于所述预设口令有效期，从所述视频信息中提取用户面部特征进行人脸识别操作。4.根据权利要求1-3中任一项所述的方法，其特征在于，所述生成随机密钥口令并返回给客户端，还包括：从所述身份识别请求中获取用户账号，基于与所述用户账号对应的用户信息，将生成的所述随机密钥口令返回给用户。5.根据权利要求4所述的方法，其特征在于，所述用户信息包括手机号或邮箱地址。6.根据权利要求1-3中任一项所述的方法，其特征在于，还包括：响应于从所述音频信息中提取用户声音特征为失败，生成更换环境信息并返回给客户端。7.一种身份识别处理方法，应用于客户端，其特征在于，包括：响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求，以接收服务端返回的随机密钥口令并显示；调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；将所述音视频信息传输给服务端，使得服务端基于所述音视频信息进行身份识别操作，基于服务端返回的处理结果进行相应操作。8.根据权利要求7所述的方法，其特征在于，在所述分别采集用户读所述随机密钥口令
的音频信息和视频信息之前，还包括：调用声音采集设备采集当前噪音分贝参数，响应于所述当前噪音分贝参数超出预设噪音分贝范围，弹出提示更换环境信息；和/或调用图像采集设备采集当前用户人脸信息，响应于当前用户人脸信息超出屏幕范围、或小于预设大小，弹出调整距离信息。9.根据权利要求7或8所述的方法，其特征在于，处理结果包括识别成功、识别失败、更换环境信息中的一种。10.一种身份识别处理装置，应用于服务端，其特征在于，包括：密钥口令模块，用于接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端；用户生物特征识别模块，用于接收客户端采集的音视频信息；其中，音视频信息包括用户读所述随机密钥口令的音频信息和视频信息；将所述音频信息转译为文本信息，响应于所述文本信息中存在所述随机密钥口令，从所述视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；响应于提取用户面部特征为失败、或者人脸识别结果为失败，从所述音频信息中提取用户声音特征，比对所述用户声音特征和目标用户声音特征，得到比对结果并返回给客户端。11.一种身份识别处理装置，应用于客户端，其特征在于，包括：请求发送模块，用于响应于用户对身份识别页面的点击操作，向服务端发送身份识别请求，以接收服务端返回的随机密钥口令并显示；信息采集模块，用于调用声音采集设备和图像采集设备，分别采集用户读所述随机密钥口令的音频信息和视频信息，以生成音视频信息；信息传输模块，用于将所述音视频信息传输给服务端，使得服务端基于所述音视频信息进行身份识别操作，基于服务端返回的处理结果进行相应操作。12.一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。13.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。14.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的方法。

技术总结
本发明公开了一种身份识别处理方法和装置，涉及生物特征识别技术领域。该方法的一具体实施方式包括：接收客户端传输的身份识别请求，生成随机密钥口令并返回给客户端，以接收客户端采集的音视频信息；将音频信息转译为文本信息，响应于文本信息中存在所述随机密钥口令，从视频信息中提取用户面部特征进行人脸识别操作，若识别结果为成功则返回给客户端；响应于提取用户面部特征为失败、或者人脸识别结果为失败，从音频信息中提取用户声音特征，比对用户声音特征和目标用户声音特征，得到比对结果并返回给客户端。该实施方式具有验证流程简便、防破解能力强、识别成功率高的优点，极大提高了用户使用体验。提高了用户使用体验。提高了用户使用体验。

技术研发人员：张攀
受保护的技术使用者：中国建设银行股份有限公司
技术研发日：2022.03.18
技术公布日：2022/7/5

转载请注明原文地址: https://www.8miu.com/read-10477.html

专利

最新回复(0)