1.本公开涉及图像识别技术领域,具体地,涉及一种答题卡识别方法、装置、存储介质以及电子设备。
背景技术:2.在答题卡的批改中,一般可以通过配套的检测设备对答题卡进行批改。但是,对于小批量的答题卡,使用配套的检测设备进行批改的成本极高。因此,目前对于小批量的答题卡批改,一般通过人工批改方式或者通过移动终端的图像识别进行批改。其中,移动终端的图像识别的准确度受拍照图像质量影响较大,而且由于图像处理算法的泛化能力较差,会造成题目定位与作答内容误识别。例如,受到拍摄角度、答题卡版式繁多的影响,会导致无法准确识别出答题卡的答案,一旦答题卡的版式发生变化,则会导致无法准确识别到填写的答案。
技术实现要素:3.本公开的目的是提供一种答题卡识别方法、装置、存储介质以及电子设备,以提高答题卡的批改准确率。
4.第一方面,本公开实施例提供一种答题卡识别方法,包括:
5.获取答题卡的拍摄图像;
6.基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,其中,所述目标检测框至少包括答题卡编号检测框、题目检测框以及答案检测框;
7.基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息;
8.基于所述编号信息,确定所述答题卡对应的标准答案;
9.基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息;
10.根据所述答案信息以及所述标准答案,获得所述答题卡的批改结果。
11.第二方面,本公开实施例提供一种答题卡识别装置,包括:
12.获取模块,配置为获取答题卡的拍摄图像;
13.检测模块,配置为基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,其中,所述目标检测框至少包括答题卡编号检测框、题目检测框以及答案检测框;
14.编号识别模块,配置为基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息;
15.标准答案确定模块,配置为基于所述编号信息,确定所述答题卡对应的标准答案;
16.答案识别模块,配置为基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息;
17.批改模块,配置为根据所述答案信息以及所述标准答案,获得所述答题卡的批改
结果。
18.第三方面,本公开实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述方法的步骤。
19.第四方面,本公开实施例提供一种电子设备,包括:
20.存储器,其上存储有计算机程序;
21.处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面所述方法的步骤。
22.基于上述技术方案,通过答题卡编号检测框、题目检测框以及答案检测框对拍摄图像进行检测,获得多个目标图像,并基于答题卡编号检测框检测到的第一目标图像,确定答题卡的编号信息,以及基于编号信息,确定答题卡对应的标准答案,以及基于题目检测框检测到的第二目标图像以及答案检测框检测到的第三目标图像,确定答题卡每一题目的答案信息,然后根据答案信息以及标准答案,获得答题卡的批改结果。不仅能够实现通过拍摄图像对答题卡进行智能批改,并且通过答题卡编号检测框、题目检测框以及答案检测框来获取目标图像,可以不受答题卡的版式、填写方式等的影响对答题卡进行精确批改。例如,无论是单栏、双栏或其他复杂版式的答题卡,均能够通过本公开实施例提出的答题卡识别方法进行批改。
23.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
24.附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
25.图1是根据一示例性实施例提供的一种答题卡识别方法的流程图。
26.图2是根据一示例性实施例示出的目标检测框的示意图。
27.图3是图1所示步骤150的详细流程图。
28.图4是图3所示步骤152的详细流程图。
29.图5是图1所示步骤110的详细流程图。
30.图6是根据一示例性实施例提供的一种答题卡识别装置的模块连接示意图。
31.图7是根据一示例性实施例提供的一种电子设备的结构示意图。
具体实施方式
32.以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
33.需要说明的是,本公开中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
34.图1是根据一示例性实施例提供的一种答题卡识别方法的流程图。如图1所示,本公开实施例提供一种答题卡识别方法,该方法可以通过电子设备执行,具体可以通过答题卡识别装置来执行,该装置可以由软件和/或硬件的方式实现,配置于电子设备中。如图1所示,该答题卡识别方法可以包括以下步骤。
35.在步骤110中,获取答题卡的拍摄图像。
36.这里,答题卡的拍摄图像可以是批改方通过拍摄装置或移动装置对答题卡进行拍摄而获得的。当然,在一些实施例中,拍摄图像可以是通过网络接收到的需要进行批改的答题卡的图像。例如,答题方可以通过移动终端对待批改的答题卡进行拍摄,获得拍摄图像,并通过网络向服务器上传该拍摄图像,以使批改方能够对该拍摄图像进行批改。
37.在步骤120中,基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,其中,所述目标检测框至少包括答题卡编号检测框、题目检测框以及答案检测框。
38.这里,在获得答题卡的拍摄图像之后,可以基于预设的目标检测框对拍摄图像进行关键目标检测,从而获得多个目标图像。图2是根据一示例性实施例示出的目标检测框的示意图,如图2所示,目标检测框包括用于检测答题卡的编号信息的答题卡编号检测框、用于检测答题卡的题目信息的题目检测框以及用于检测答题卡的答案信息的答案检测框。
39.应当理解的是,在答题卡包括其他信息的情况下,目标检测框还可以包括其他检测框。例如,目标检测框还可以包括用于检测答题卡姓名的姓名检测框、包括用于检测答题卡的页码的页码检测框以及用于检测答题卡上填写的学号的学号检测框等等。
40.值得说明的是,图2所示的答题卡图像仅用于对目标检测框进行举例说明,关于图2中的文字以及符号是否清晰不影响技术方案的理解。
41.示例性地,可以将拍摄图像作为训练好的目标检测模型的输入,该目标检测模型通过预设的目标检测框从拍摄图像中提取多个目标图像。其中,在该目标检测模型中,目标检测框相当于是在目标检测模型中的至少一个子模型。例如,题目检测框可以是目标检测模型中的一个网络层,如cnn网络等。
42.值得说明的是,目标检测模型是基于第一训练样本进行机器学习训练得到的,该第一训练样本为通过所述答题卡编号检测框、所述题目检测框以及所述答案检测框对相应区域进行标注的答题卡图像。
43.在步骤130中,基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息。
44.这里,第一目标图像是从拍摄图像中提取到的携带答题卡编号的子图像。在通过答题卡编号检测框从拍摄图像中提取到第一目标图像之后,根据该第一目标图像,确定该答题卡的编号信息。其中,答题卡的编号信息是指该答题卡对应的试卷编号。例如,每进行一次考试,该场考试所使用的答题卡的编号信息是唯一的。
45.示例性地,可以通过对第一目标图像进行图像识别处理,从而从第一目标图像中提取得到答题卡的编号信息。
46.在步骤140中,基于所述编号信息,确定所述答题卡对应的标准答案。
47.这里,在获得答题卡的编号信息之后,可以基于该编号信息从数据库中获取该答题卡对应的标准答案。其中,标准答案可以是批改方上传至数据库中的表示该答题卡对应的试卷的答案。
48.在一些实施例中,在数据库中存储有不同编号信息以及每一编号信息对应的标准答案。应当理解的是,该数据库可以是本地数据库,也可以是云端数据库。
49.在步骤150中,基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息。
50.这里,第二目标图像是通过题目检测框从拍摄图像中提取到的携带有题目信息的子图像。其中,题目信息至少包括题目的编号信息。第三目标图像是通过答案检测框从拍摄图像中提取到的携带有答案信息的子图像。其中,答案信息至少包括用户填写的填写答案。
51.在获得第二目标图像以及第三目标图像之后,可以根据该第二目标图像以及第三目标图像确定该答题卡中的每一题目的答案信息。其中,答案信息包括题目编号以及每一题目编号对应的填写答案。
52.示例性地,可以通过对第二目标图像以及第三目标图像进行图像识别处理,从而确定每一第二目标图像对应的题目编号以及该题目编号对应的第三目标图像中的填写答案。
53.在步骤160中,根据所述答案信息以及所述标准答案,获得所述答题卡的批改结果。
54.这里,在获得答题卡的每一题目的答案信息之后,根据对答案信息与标准答案进行比对,获得答题卡的批改结果。其中,批改结果至少包括该答题卡的得分以及每个题目的对错。
55.由此,通过答题卡编号检测框、题目检测框以及答案检测框对拍摄图像进行检测,获得多个目标图像,并基于答题卡编号检测框检测到的第一目标图像,确定答题卡的编号信息,以及基于编号信息,确定答题卡对应的标准答案,以及基于题目检测框检测到的第二目标图像以及答案检测框检测到的第三目标图像,确定答题卡每一题目的答案信息,然后根据答案信息以及标准答案,获得答题卡的批改结果。不仅能够实现通过拍摄图像对答题卡进行智能批改,并且通过答题卡编号检测框、题目检测框以及答案检测框来获取目标图像,可以不受答题卡的版式、填写方式等的影响对答题卡进行精确批改。例如,无论是单栏、双栏或其他复杂版式的答题卡,均能够通过本公开实施例提出的答题卡识别方法进行批改。
56.图3是图1所示步骤150的详细流程图。如图3所示,在一些可以实现的实施方式中,步骤150中,基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息,可以包括以下步骤。
57.在步骤151中,根据所述题目检测框检测到的每一所述第二目标图像以及所述答案检测框检测到的每一所述第三目标图像之间的相对位置关系,在所述拍摄图像中确定多个题目块图像,一个所述题目块图像包括一个所述第二目标图像以及与该第二目标图像对应的第三目标图像。
58.这里,通过题目检测框从拍摄图像中检测到的第二目标图像以及通过答案检测框从拍摄图像中检测到的第三目标图像的数量均是多个以上的,因此需要为每一第二目标图像匹配该第二目标图像对应的题目编号对应的第三目标图像。
59.其中,每一第二目标图像以及每一第三目标图像在拍摄图像中的位置信息是固定的,因此,可以根据第二目标图像和第三目标图像之间的相对位置关系,在拍摄图像中确定出多个题目块图像。每一题目块图像包括一个第二目标图像以及该第二目标图像对应的第三目标图像。
60.应当理解的是,相对位置关系反映了第二目标图像与第三目标图像的距离远近以及方位信息。通过相对位置关系,可以对提取到的多个第二目标图像以及第三目标对象进
行配对,以获得多个题目块图像。
61.在步骤152中,针对每一所述题目块图像中的第二目标图像以及第三目标图像,确定所述题目块图像中包括的题目编号以及填写答案。
62.这里,在获得多个题目块图像之后,对每一题目块图像中的第二目标图像以及第三目标图像进行图像识别,以获得对应的题目编号以及填写答案。
63.由此,通过根据第二目标图像和第三目标图像之间的相对位置关系,可以对提取到的多个第二目标图像以及第三目标对象进行精确配对,从而对答题卡进行切题操作,以提高答案信息的识别准确率。
64.图4是图3所示步骤152的详细流程图。如图4所示,在一些可以实现的实施方式中,填写答案可以通过以下步骤获得。
65.在步骤1521中,对所述题目块图像中的第一图像进行文本识别,得到所述第一图像的文本信息。
66.这里,答案检测框可以包括未涂写检测框以及已涂写检测框,所述第三目标图像包括通过所述未涂写检测框检测到的第一图像以及通过所述已涂写检测框检测到的第二图像。其中,在答题卡中,每一作答区域可以通过编号表示对应题目的选项,被勾选或者涂写的选项为用户选择的答案。例如,对于题目1,其对应的选项包括“a”、“b”、“c”、“d”。若用户对选项“a”的所在区域进行涂写,则表示用户选择的填写答案为“a”。因此,第一图像实际上是指答题卡的作答区域中未被涂写的区域对应的子图像,第二图像实际上是指答题卡的作答区域中已涂写的区域对应的子图像。
67.在获得第一图像之后,可以通过对第一图像进行文本识别,确定未被用户涂写的第一图像中包括的文本信息。例如,第一图像可以包括“a”、“b”、“c”未被涂写的文本信息。应当理解的是,针对不同的答题卡类型,对应的文本信息可以不同,其可以是文字,也可以是符号、图形以及数字等等形式。
68.示例性地,对第一图像进行文本识别的具体过程可以包括:利用spatial transformer network(空间变换网络)对第一图像进行校正,以对第一图像中弯曲或倾斜的文本进行校正。然后将校正后的第一图像作为特征提取网络的输入,获得字符特征。其中,特征提取网络用于从第一图像中提取与字符相关的特征,同时过滤掉一些无关特征,比如颜色、字体、尺寸、背景等信息。在一些实施例中,特征提取网络可以是resnet50网络。将字符特征作为编码网络的输入,获得特征向量。其中,编码网络用于从字符特征中捕获上下文信息,并将字符特征编码为对应的特征向量。在一些实施例中,该编码网络可以为bilstm网络。在获得特征向量之后,可以基于注意力模型对该特征向量进行处理,获得该第一图像中包含的文本信息。
69.在步骤1522中,基于所述题目块图像中的第二图像在所述题目块图像中的位置信息以及所述第一图像的文本信息,确定所述填写答案。
70.这里,第二图像是被用户涂写的图像,因此无法对该第二图像进行文本识别处理。通过第二图像在该题目块图像中的位置信息以及第一图像的文本信息可以确定用户实际涂写的区域,从而获得填写答案。
71.其中,第二图像在该题目块图像中的位置信息实际是指第二图像在拍摄图像上的坐标信息。通过该位置信息可以准确定位用户涂写的选项。
72.例如,选项包括“a”、“b”、“c”、“d”,若用户实际涂写的选项为“d”,则获得的位置信息为“d”的位置信息,文本信息为“a”、“b”以及“c”的字母信息。
73.应当理解的是,通过位置信息以及文本信息相结合,可以避免出现文本识别不准确或位置定位不准确而导致的答案识别错误的问题,使得最终确定到的填写答案更加准确。
74.在一些可以实现的实施方式中,可以将拍摄图像作为目标检测模型的输入,获得多个标注图像,并基于多个所述标注图像之间的相对位置关系,对所述标注图像进行倾斜校正,获得所述目标图像。
75.这里,目标检测模型通过答题卡编号检测框、题目检测框以及答案检测框从拍摄图像中提取标注图像,在获得多个标注图像之后,根据多个标注图像之间的相对位置关系,对每一标注图像进行倾斜校正,并将校正后的各个标注图像确定为目标图像。
76.其中,多个标注图像之间的相对位置关系反映了拍摄图像中的各个元素之间的角度关系。例如,通过答题卡编号检测框确定到的答题卡编号、通过题目检测框确定到的题目编号以及通过答案检测框确定到的答案信息在拍摄图像中的相对位置关系,反映了拍摄图像中的各个元素的形变或者拍摄角度变化,通过该相对位置关系可以对提取到的标注图像进行倾斜校正,从而避免出现因拍照角度问题而造成的无法准确识别答题卡的问题。
77.值得说明的是,目标检测模型可以利用cascade r-cnn(一种目标检测算法)从拍摄图像中提取目标图像。
78.图5是图1所示步骤110的详细流程图。如图5所示,在一些可以实现的实施方式中,步骤110中,获取答题卡的拍摄图像,可以包括以下步骤。
79.在步骤111中,获取答题卡图像。
80.这里,可以通过对答题卡进行拍摄,以获取答题卡图像。
81.在步骤112中,对所述答题卡图像进行分割,获得包含答题卡文本区域的前景图像。
82.这里,在答题卡图像中包括前景图像以及背景图像。其中,前景图像为包含答题卡文本区域的图像,背景图像则为除答题卡文本区域外的图像。通过对答题卡图像进行分割,可以过滤无用的背景信息,排除背景图像对答题卡识别造成的干扰。
83.在一些实施例中,可以通过shufflenetv2网络对答题卡图像进行分割,获得前景图像。
84.在步骤113中,计算所述前景图像的边缘轮廓点,并基于所述边缘轮廓点构建最小外接矩形。
85.这里,边缘轮廓点是指在前景图像的边缘上的多个预设点位。其中,边缘轮廓点的个数可以预设的,例如16个。通过16个边缘轮廓点,描述前景图像的形状。基于所述边缘轮廓点构建最小外接矩形可以是通过从边缘轮廓点任意选择4个边缘轮廓点构建外接矩形,并将面积最小的矩形确定为最小外接矩形。
86.在步骤114中,基于所述最小外接矩形对所述前景图像进行分割,得到分割图像。
87.这里,通过该最小外接矩形对前景图像进行分割,获得分割图像。其中,通过最小外接矩形对前景图像进行分割可以获得标准矩形的分割图像。
88.在步骤115中,对所述分割图像进行透视变换处理,获得校正后的图像。
89.这里,通过对分割图像进行透视变换处理,可以排除因拍摄的透视变形对最终识别结果的影响。
90.在步骤116中,对所述校正后的图像进行预处理,获得所述答题卡的拍摄图像。
91.这里,预处理可以包括对校正后的图像进行阴影去除、提升对比度等图像增强操作,从而获得拍摄图像。
92.由此,通过步骤111至步骤116获得的拍摄图像,可以排除在后续识别过程中因为拍摄图像模糊、光线干扰、背景杂乱、透视变形、图像质量等因素对答题卡识别造成的干扰,使得识别结果能够更加准确。
93.在一些可以实现的实施方式中,步骤130中,可以将所述第一目标图像作为训练好的识别模型的输入,获得所述答题卡的编号信息;其中,所述识别模型包括依次连接的文本校正层、特征提取层、序列建模层以及预测层,所述文本校正层用于对所述第一目标图像进行倾斜校正,所述特征提取层用于提取文本特征,所述序列建模层用于所述文本特征的上下文信息构建文本序列特征,所述预测层用于根据所述文本序列特征获得所述答题卡的编号信息。
94.这里,文本校正层可以为空间变换网络,通过空间变换网络对第一目标图像进行倾斜校正,获得校正图像。然后将校正图像作为特征提取层的输入,获得文本特征。其中,特征提取层用于从第一目标图像中提取与字符相关的文本特征,同时过滤掉一些无关特征,比如颜色、字体、尺寸、背景等信息。在一些实施例中,特征提取层可以是resnet50网络。将文本特征作为序列建模层的输入,获得文本序列特征。其中,序列建模层用于从文本特征中捕获上下文信息,并基于上下文信息将文本特征编码为对应的文本序列特征。在一些实施例中,该序列建模层可以为bilstm网络。在获得文本序列特征之后,将文本序列特征作为预测层的输入,获得答题卡的编号信息。其中,预测层可以基于注意力模型对该文本序列特征进行处理,获得该第一目标图像中包含的编号信息。
95.图6是根据一示例性实施例提供的一种答题卡识别装置的模块连接示意图。如图6所示,本公开实施例提供一种答题卡识别装置,该装置600包括:
96.获取模块601,配置为获取答题卡的拍摄图像;
97.检测模块602,配置为基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,其中,所述目标检测框至少包括答题卡编号检测框、题目检测框以及答案检测框;
98.编号识别模块603,配置为基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息;
99.标准答案确定模块604,配置为基于所述编号信息,确定所述答题卡对应的标准答案;
100.答案识别模块605,配置为基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息;
101.批改模块606,配置为根据所述答案信息以及所述标准答案,获得所述答题卡的批改结果。
102.可选地,所述答案识别模块605包括:
103.切题单元,配置为根据所述题目检测框检测到的每一所述第二目标图像以及所述
答案检测框检测到的每一所述第三目标图像之间的相对位置关系,在所述拍摄图像中确定多个题目块图像,一个所述题目块图像包括一个所述第二目标图像以及与该第二目标图像对应的第三目标图像;
104.识别单元,配置为针对每一所述题目块图像中的第二目标图像以及第三目标图像,确定所述题目块图像中包括的题目编号以及填写答案。
105.可选地,所述答案检测框包括未涂写检测框以及已涂写检测框,所述第三目标图像包括所述未涂写检测框检测到的第一图像以及所述已涂写检测框检测到的第二图像;所述识别单元包括:
106.文本识别单元,配置为对所述题目块图像中的第一图像进行文本识别,得到所述第一图像的文本信息;
107.答案确定子单元,配置为基于所述题目块图像中的第二图像在所述题目块图像中的位置信息以及所述第一图像的文本信息,确定所述填写答案。
108.可选地,所述检测模块602具体配置为:
109.将所述拍摄图像作为目标检测模型的输入,获得多个目标图像;
110.其中,所述目标检测模型是基于第一训练样本进行机器学习训练得到的,该第一训练样本为通过所述答题卡编号检测框、所述题目检测框以及所述答案检测框对相应区域进行标注的答题卡图像。
111.可选地,所述检测模块602包括:
112.图像提取单元,配置为将所述拍摄图像作为目标检测模型的输入,获得多个标注图像;
113.校正单元,配置为基于多个所述标注图像之间的相对位置关系,对所述标注图像进行倾斜校正,获得所述目标图像。
114.可选地,所述获取模块601包括:
115.图像获取单元,配置为获取答题卡图像;
116.第一图像分割单元,配置为对所述答题卡图像进行分割,获得包含答题卡文本区域的前景图像;
117.轮廓单元,配置为计算所述前景图像的边缘轮廓点,并基于所述边缘轮廓点构建最小外接矩形;以及
118.第二图像分割单元,配置为基于所述最小外接矩形对所述前景图像进行分割,得到分割图像;
119.变换单元,配置为对所述分割图像进行透视变换处理,获得校正后的图像;
120.预处理单元,配置为对所述校正后的图像进行预处理,获得所述答题卡的拍摄图像。
121.可选地,所述编号识别模块603具体配置为:
122.将所述第一目标图像作为训练好的识别模型的输入,获得所述答题卡的编号信息;
123.其中,所述识别模型包括依次连接的文本校正层、特征提取层、序列建模层以及预测层,所述文本校正层用于对所述第一目标图像进行倾斜校正,所述特征提取层用于提取文本特征,所述序列建模层用于所述文本特征的上下文信息构建文本序列特征,所述预测
层用于根据所述文本序列特征获得所述答题卡的编号信息。
124.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
125.图7是根据一示例性实施例示出的一种电子设备700的框图。如图7所示,该电子设备700可以包括:处理器701,存储器702。该电子设备700还可以包括多媒体组件703,输入/输出(i/o)接口704,以及通信组件705中的一者或多者。
126.其中,处理器701用于控制该电子设备700的整体操作,以完成上述的答题卡识别方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作,这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(static random access memory,简称sram),电可擦除可编程只读存储器(electrically erasable programmable read-only memory,简称eeprom),可擦除可编程只读存储器(erasable programmable read-only memory,简称eprom),可编程只读存储器(programmable read-only memory,简称prom),只读存储器(read-only memory,简称rom),磁存储器,快闪存储器,磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器,用于输出音频信号。i/o接口704为处理器701和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信,例如wi-fi,蓝牙,近场通信(near field communication,简称nfc),2g、3g、4g、nb-iot、emtc、或其他5g等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件705可以包括:wi-fi模块,蓝牙模块,nfc模块等等。
127.在一示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(application specific integrated circuit,简称asic)、数字信号处理器(digital signal processor,简称dsp)、数字信号处理设备(digital signal processing device,简称dspd)、可编程逻辑器件(programmable logic device,简称pld)、现场可编程门阵列(field programmable gate array,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的答题卡识别方法。
128.在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的答题卡识别方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器702,上述程序指令可由电子设备700的处理器701执行以完成上述的答题卡识别方法。
129.以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
130.另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛
盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
131.此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
技术特征:1.一种答题卡识别方法,其特征在于,包括:获取答题卡的拍摄图像;基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,其中,所述目标检测框至少包括答题卡编号检测框、题目检测框以及答案检测框;基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息;基于所述编号信息,确定所述答题卡对应的标准答案;基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息;根据所述答案信息以及所述标准答案,获得所述答题卡的批改结果。2.根据权利要求1所述的答题卡识别方法,其特征在于,所述基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息,包括:根据所述题目检测框检测到的每一所述第二目标图像以及所述答案检测框检测到的每一所述第三目标图像之间的相对位置关系,在所述拍摄图像中确定多个题目块图像,一个所述题目块图像包括一个所述第二目标图像以及与该第二目标图像对应的第三目标图像;针对每一所述题目块图像中的第二目标图像以及第三目标图像,确定所述题目块图像中包括的题目编号以及填写答案。3.根据权利要求2所述的答题卡识别方法,其特征在于,所述答案检测框包括未涂写检测框以及已涂写检测框,所述第三目标图像包括所述未涂写检测框检测到的第一图像以及所述已涂写检测框检测到的第二图像;所述填写答案是通过如下方式确定的:对所述题目块图像中的第一图像进行文本识别,得到所述第一图像的文本信息;基于所述题目块图像中的第二图像在所述题目块图像中的位置信息以及所述第一图像的文本信息,确定所述填写答案。4.根据权利要求1所述的答题卡识别方法,其特征在于,所述基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,包括:将所述拍摄图像作为目标检测模型的输入,获得多个目标图像;其中,所述目标检测模型是基于第一训练样本进行机器学习训练得到的,该第一训练样本为通过所述答题卡编号检测框、所述题目检测框以及所述答案检测框对相应区域进行标注的答题卡图像。5.根据权利要求4所述的答题卡识别方法,其特征在于,所述将所述拍摄图像作为目标检测模型的输入,获得多个目标图像,包括:将所述拍摄图像作为目标检测模型的输入,获得多个标注图像;基于多个所述标注图像之间的相对位置关系,对所述标注图像进行倾斜校正,获得所述目标图像。6.根据权利要求1所述的答题卡识别方法,其特征在于,所述获取答题卡的拍摄图像,包括:获取答题卡图像;
对所述答题卡图像进行分割,获得包含答题卡文本区域的前景图像;计算所述前景图像的边缘轮廓点,并基于所述边缘轮廓点构建最小外接矩形;以及基于所述最小外接矩形对所述前景图像进行分割,得到分割图像;对所述分割图像进行透视变换处理,获得校正后的图像;对所述校正后的图像进行预处理,获得所述答题卡的拍摄图像。7.根据权利要求1所述的答题卡识别方法,其特征在于,所述基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息,包括:将所述第一目标图像作为训练好的识别模型的输入,获得所述答题卡的编号信息;其中,所述识别模型包括依次连接的文本校正层、特征提取层、序列建模层以及预测层,所述文本校正层用于对所述第一目标图像进行倾斜校正,所述特征提取层用于提取文本特征,所述序列建模层用于所述文本特征的上下文信息构建文本序列特征,所述预测层用于根据所述文本序列特征获得所述答题卡的编号信息。8.一种答题卡识别装置,其特征在于,包括:获取模块,配置为获取答题卡的拍摄图像;检测模块,配置为基于预设的目标检测框对所述拍摄图像进行检测,获得多个目标图像,其中,所述目标检测框至少包括答题卡编号检测框、题目检测框以及答案检测框;编号识别模块,配置为基于所述答题卡编号检测框检测到的第一目标图像,确定所述答题卡的编号信息;标准答案确定模块,配置为基于所述编号信息,确定所述答题卡对应的标准答案;答案识别模块,配置为基于所述题目检测框检测到的第二目标图像以及所述答案检测框检测到的第三目标图像,确定所述答题卡每一题目的答案信息;批改模块,配置为根据所述答案信息以及所述标准答案,获得所述答题卡的批改结果。9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。10.一种电子设备,其特征在于,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
技术总结本公开涉及一种答题卡识别方法、装置、存储介质以及电子设备,涉及图像识别技术领域,该方法包括通过答题卡编号检测框、题目检测框以及答案检测框对拍摄图像进行检测,并基于答题卡编号检测框检测到的第一目标图像,确定答题卡对应的标准答案,以及基于题目检测框检测到的第二目标图像以及答案检测框检测到的第三目标图像,确定答题卡每一题目的答案信息,然后根据答案信息以及标准答案,获得答题卡的批改结果。不仅能够实现通过拍摄图像对答题卡进行智能批改,并且可以不受答题卡的版式、填写方式等的影响对答题卡进行精确批改。例如,无论是单栏、双栏或其他复杂版式的答题卡,均能够通过本公开实施例提出的答题卡识别方法进行批改。进行批改。进行批改。
技术研发人员:张飞飞 尹成浩 张明 杜竹君 王彦君 马志国
受保护的技术使用者:北京开拓鸿业高科技有限公司
技术研发日:2022.03.28
技术公布日:2022/7/5