一种基于神经网络的手写英文文本识别方法

allin2022-09-11 273

1.本发明涉及文字识别技术领域，尤其涉及一种基于神经网络的手写英文文本识别方法。

背景技术：

2.随着社会的发展，越来越多的领域迎来了数字化的浪潮，比如图书馆藏书的数字化、快递邮政的数字化以及企业的办公数字化，在这种数字化的浪潮中，手写文本识别成为了一个重要的任务。目前来说，全球大部分人口使用的语言仍然是英文，因此对于手写英文文本的识别就成为了一个重要的需求。
3.然而当前对于手写英文文本的识别的解决方案存在着难以结合文本前后文信息、文本单词划分方法复杂以及由于识别结果单一导致的识别灵活性与准确性受限等问题。同时，在手写英文文本的过程中存在着可能由于某些种类字母形状相似加上书写时的不规范导致的识别准确率受到负面影响的问题。
4.现有的算法存在非极大值抑制的问题，导致在识别时常常出现错误，出现假阳性或假阴性错误；同时，现有算法在字母分割时经常出现问题，导致单词被错误拆分，影响识别的准确性。

技术实现要素：

5.发明目的：针对现有技术的不足，本发明提供了一种基于神经网络的手写英文文本识别方法。
6.技术方案：一种基于神经网络的手写英文文本识别方法，包括以下步骤：
7.s101、获取包括所有种类英文字母的手写英文文本数据集作为母数据集；
8.依序从所述母数据集中剔除至少一类英文字母，构建若干个子数据集；
9.以所述母数据集和子数据集作为训练数据，采用yolo算法训练得到字母识别母模型和若干个字母识别子模型；
10.s102、获取包含以句子为单位的具有语法错误的非手写英文文本数据集，采用lstm算法训练得到语法判断模型；
11.s103、获取包含预定数量单词的词典，构建词典模块。
12.根据本技术的一个方面，还包括：
13.s104、获取手写英文文本测试图片，采用所述字母识别母模型进行识别，将识别结果利用预置的单词提取算法进行处理，得到单词初次识别结果，并形成文本初次识别结果；
14.s105、采用词典模块判断单词初次识别结果是否都存在于词典中，如有不存在于词典中的单词，则判断单词初次识别结果中具有异常情况，并将不存在于词典中的单词标记为异常单词；
15.s106、将所述异常单词从图片中裁剪出来，利用所述若干个字母识别子模型分别进行识别，得到异常单词的多个单词二次识别结果，并利用单词二次识别结果对所述初次
识别结果进行替换，得到若干个文本二次识别结果；
16.s107、采用所述词典模块检验依次检验文本二次识别结果，将文本二次识别结果分为单词均存在的文本二次识别结果和单词非均存在的文本二次识别结果，采用所述语法判断模型将单词均存在的文本二次识别结果分为符合语法规范的文本二次识别结果和不符合语法规范的文本二次识别结果；
17.s108、将所有识别结果进行优先级排序：
18.所述符合语法规范的文本二次识别结果＞所述文本初次识别结果＞所述不符合语法规范的文本二次识别结果＞所述单词非均存在的文本二次识别结果；
19.将所有识别结果按所述优先级由高到低顺序输出。
20.根据本技术的一个方面，步骤s101中构建若干个子数据集的过程为：采集识别时会发生混淆情况的至少两个字母，构建易混淆字母集；每次从母数据集中分别剔除易混淆字母集中的一个字母，构建除已剔除字母外的其他字母组成子数据集。
21.根据本技术的一个方面，步骤s101、所述基于yolo算法的模型结构中的卷积层包含运算有：卷积运算、批标准化以及激活函数，在生成权重和偏置数据用于推理时，将卷积和批标准化合并加快推理速度，激活函数y为：
[0022][0023]
x为函数输入，y为函数输出。
[0024]
根据本技术的一个方面，步骤s104所述单词提取算法具体步骤如下：
[0025]
s201：yolo算法输出的识别目标框的信息包括：识别目标框中心点位置、识别目标框长和宽、识别目标类别以及置信度，根据中心点在y轴位置确定位于同一行的识别目标，根据中心点的x轴位置大小将识别对象从左至右排序得到字符序列，该字符序列为等待单词分割的英文语句，同时利用所述识别目标框信息求得字母间距。
[0026]
根据本技术的一个方面，求字母间距的步骤为：
[0027]
计算相邻字母识别框之间在y轴方向上的重叠度；
[0028]
重叠度大于第一阈值时，字母间距等于右字母识别框左边x轴位置减去左字母识别框右边x轴位置；
[0029]
重叠度大于第二阈值且小于第一阈值时，字母间距等于右字母识别框左边x轴位置减去左字母识别框右边x轴位置的值除以两个边框中心点位置连线与x轴夹角的cos函数的值；
[0030]
重叠度小于第二阈值时，字母间距等于两识别框中心点间距减去两识别框在x轴上宽度之和的二分之一。
[0031]
s202：利用s201所述字符序列信息需要对字符中添加空格使其变成实际文本内容。
[0032]
根据本技术的一个方面，添加空格的过程为：利用s201所述字母间距，对字母间距大于s的位置加入空格，用数学的方式表达为：
[0033]
s＝e(γ)
×
t，
[0034]
[0035]
β为所有字母间距从小到大排列的序列，βm为最接近序列β平均值的β中的项，n为β项数除4后向下取整，i为自然数，γ为β中βm左边所有项新构成的子序列，e(γ)为γ求均值。
[0036]
根据本技术的一个方面，步骤s106中所述二次识别方法为：采取保留nms非极大值抑制算法且通过利用所述字母识别子模型中对应的剔除当前最大置信度字母类别的字母识别子模型进行所述二次识别。
[0037]
有益效果：本方法结合yolo和lstm两种人工智能算法以及一种新的单词提取算法，可以检测带有以句子为单位的手写英文文本的图片中的英文文本内容，同时可以检测英文文本中可能出现的拼写和语法错误，在出现错误时可以提供多种可能识别结果，并给出不同结果的优先级。
附图说明
[0038]
图1是实施例1提供的一种基于神经网络的手写英文文本识别方法的流程示意图。
[0039]
图2a是实施例1提供的一种基于神经网络的手写英文文本识别方法的结构拓扑图。
[0040]
图2b是实施例1提供的一种基于神经网络的手写英文文本识别方法的数据流示意图。
[0041]
图3是实施例1提供的一种基于神经网络的手写英文文本识别方法的无语法错误且无拼写错误的手写英文文本首次识别结果图。
[0042]
图4是实施例1提供的一种基于神经网络的手写英文文本识别方法的有语法错误且无拼写错误的手写英文文本首次识别结果图。
[0043]
图5是实施例1提供的一种基于神经网络的手写英文文本识别方法的两种手写英文文本的识别结果打印图。
[0044]
图6是实施例1提供的一种基于神经网络的手写英文文本识别方法的有拼写错误手写英文文本的首次识别结果图。
[0045]
图7是实施例1提供的一种基于神经网络的手写英文文本识别方法的词典模块中异常单词的字母被截取出来进行二次识别后，有二次识别结果的字母的识别结果图。
[0046]
图8是实施例1提供的一种基于神经网络的手写英文文本识别方法的词典模块中异常单词的字母被截取出来进行二次识别后，无二次识别结果的字母的识别结果图。
[0047]
图9是实施例1提供的一种基于神经网络的手写英文文本识别方法的有二次识别结果图片的识别结果打印图。
具体实施方式
[0048]
需要说明的是，在申请各个实施例中，英文文本包含26个大小写普通英文字符，还包括英文语境下常见的希腊字符和罗马字符。为了简化描述，统称为英文文本。换句话说，这里的英文文本是广义的概念，不是狭义的26个英文字符。
[0049]
如图1所示，本发明采用的基于神经网络的手写英文文本识别方法，包含如下步骤：
[0050]
s101、获取包括所有种类英文字母的手写英文文本数据集作为母数据集；
[0051]
依序从所述母数据集中剔除至少一类英文字母，构建若干个子数据集；
[0052]
以所述母数据集和子数据集作为训练数据，采用yolo算法训练得到字母识别母模型和若干个字母识别子模型；
[0053]
步骤s101中，字母识别母模型与字母识别子模型相比，前者识别类别要比后者多，网络结构因此不同，权重与偏置也不同，两者在训练时需要进行多次迭代直到准确率稳定。母模型与子模型的作用和功能在下文描述。
[0054]
s102、获取包含以句子为单位的具有语法错误的非手写英文文本数据集，采用lstm算法训练得到语法判断模型；
[0055]
步骤s102中，英文文本数据集应包含多种语法错误，用lstm算法检测英文文本语法错误前应将数据集中词语从文本转换成词向量，也可以采用现有方法实现，此处不详细介绍。
[0056]
s103、获取包含预定数量单词的词典，构建词典模块；
[0057]
步骤103中词典模块构建可采用现有方法，此处不详细介绍。
[0058]
s104、获取手写英文文本测试图片，采用所述字母识别母模型进行识别，将识别结果利用预置的单词提取算法进行处理，得到单词初次识别结果，并形成文本初次识别结果；
[0059]
步骤s104中，单词提取算法能够借助yolo输出单词识别框的中心点信息与长宽信息进行单词划分，当文本书写时与水平方向产生较大偏移时，单词提取算法在求字母间距时会采取不同方法。
[0060]
s105、采用词典模块判断单词初次识别结果是否都存在于词典中，如有不存在于词典中的单词，则判断单词初次识别结果中具有异常情况，并将不存在于词典中的单词标记为异常单词；
[0061]
步骤s105中，如图2a和2b所示，当初次识别结果中所有单词在词典中全部存在时，则不需要进入步骤s106，直接通过语法判断模型输出是否有语法错误，并输出结果，此情况下只需要进行初次识别不需要进行二次识别，如图3和图4所示，为此情况下两种英文文本的初次识别结果，如图5所示，为此情况下两种英文文本的识别结果打印。
[0062]
s106、将所述异常单词从图片中裁剪出来，利用所述若干个字母识别子模型分别进行识别，得到异常单词的多个单词二次识别结果，并利用单词二次识别结果对所述初次识别结果进行替换，得到若干个文本二次识别结果；
[0063]
步骤s106中，如图2a和2b所示，当初次识别结果中所有单词在词典中并非全部存在时，则需要进入步骤s106。
[0064]
如图6所示，该测试图片的初次识别结果为“ne do it”，其中单词“ne”在字典中不存在，为异常单词，如图7和图8所示，分别为异常单词的每个字母被截取后进行的二次识别结果，图7为有二次识别结果，图8为无二次识别结果。
[0065]
如果采用现有的yolo算法，由于存在非极大值抑制，则无法获取正确的结果，而通过不含n的字母识别子模型，识别其还具有h的可能性，因此可以生成二次识别结果，供用户选择。
[0066]
s107、采用所述词典模块检验依次检验文本二次识别结果，将文本二次识别结果分为单词均存在的文本二次识别结果和单词非均存在的文本二次识别结果，采用所述语法判断模型将单词均存在的文本二次识别结果分为符合语法规范的文本二次识别结果和不
符合语法规范的文本二次识别结果；
[0067]
步骤s107中，即使异常单词中每个字母都进行了二次识别，也未必每个字母都一定会有其他识别结果，需要其他识别结果具备一定置信度，本实施例中设置为置信度大于0.25时才会保留其他识别结果。
[0068]
s108、所述符合语法规范的文本二次识别结果＞所述文本初次识别结果＞所述不符合语法规范的文本二次识别结果＞所述单词非均存在的文本二次识别结果；
[0069]
将所有识别结果按所述优先级由高到低顺序输出。
[0070]
步骤s108中，如图9所示，为存在二次识别结果的测试图片的识别结果打印图。
[0071]
进一步地，步骤s101中所述构建多种子数据集的方式为：字母“i”与字母“l”相近，经过实际识别后发现有互相识别混淆情况，因此应该将步骤s101所述具备所有种类英文字母的手写英文文本数据集中字母“i”剔除制作子训练集a和将字母“l”剔除制作子训练集b。
[0072]
字母“a”与字母“q”与字母“g”相近，经过实际识别后发现有相互识别混淆情况，因此应该将步骤s101所述具备所有种类英文字母的手写英文文本数据集中字母“a”剔除制作子训练集a，将字母“q”剔除制作子训练集b，将字母“g”剔除制作子训练集c，将字母“a”和“q”剔除制作子训练集d，将字母“g”和“q”剔除制作子训练集e，将字母“a”和“g”剔除制作子训练集f；对于其他字母同理。
[0073]
需要说明的是，如果是9和g、α和a相互混淆，数字1和英文小写l相互混淆，可采用上述方法，构建子训练集。
[0074]
因此根据情况对字母进行分组，每组包含至少两个易混淆的字母，针对这组字母，生成从母数据集中剔除易混淆字母中一个字母的子数据集。对于其他组的易混淆字母，采用相同的方法构建子数据集。
[0075]
进一步地，步骤s101、所述基于yolo算法的模型结构中的卷积层包含运算有：卷积运算、批标准化以及激活函数，在生成权重和偏置数据用于推理时，将卷积和批标准化合并加快推理速度，激活函数y为：
[0076][0077]
x为函数输入，y为函数输出。
[0078]
进一步地，步骤s104所述单词提取算法具体步骤如下：
[0079]
s201：yolo神经网络模型输出包含识别目标框的信息有：识别目标框中心点位置、识别目标框长和宽、识别目标类别以及置信度，根据中心点在y轴位置确定位于同一行的识别目标，根据中心点的x轴位置大小将识别对象从左至右排序得到字符序列，该字符序列为等待单词分割的英文语句，例如有一张写了一条英文语句为“he did it”的图片，那么识别出来的字符序列经过排序后应该是：“hedidit”。同时利用所述识别目标框信息求得字母间距，求字母间距的方法为：
[0080]
计算相邻字母识别框之间在y轴方向上的重叠度；
[0081]
重叠度大于60％时，字母间距等于右字母识别框左边x轴位置减去左字母识别框右边x轴位置；
[0082]
重叠度大于30％且小于60％时，字母间距等于右字母识别框左边x轴位置减去左字母识别框右边x轴位置的值除以两个边框中心点位置连线与x轴(水平方向)夹角(锐角)
的cos函数的值；
[0083]
重叠度小于30％时，字母间距等于两识别框中心点间距减去两识别框在x轴方向上宽度之和的二分之一。
[0084]
本实施例中，设定了两个阈值，第一阈值为60％，第二阈值为30％。在其他实施例中，可以调整具体的参数，或者调整阈值的个数。
[0085]
s202：利用s201所述字符序列信息需要对字符中添加空格使其变成实际文本内容，添加方式为：利用s201所述字母间距，对字母间距大于s的位置加入空格，用数学的方式表达为：
[0086]
s＝e(γ)
×
t，
[0087][0088]
β为所有字母间距从小到大排列的序列，βm为最接近序列β平均值的β中的项，n为β项数除4后向下取整，i为自然数，γ为β中βm左边所有项新构成的子序列，e(γ)为γ求均值。具体例子如下：
[0089]
利用步骤s201所述字符序列信息，需要往字符序列中添加空格让“hedidit”变成实际上的“he did it”，该序列有7个字母，因此字母之间的间隔共有7-1＝6个，利用s201所述字母间距，当字母间距为负数时，为负数的间距需要置零，我们把这6个间隔作为一个序列α，假设α为{0.0,1.0,0.5,0.4,1.5,0.3}
[0090]
那么对应字母“h”与“e”之间间隔为0.0，“e”与第一个“d”的间距为1.0，第一个“d”与第一个“i”间距为0.5，以此类推，α共有6项，对项数除以4后向下取整求得n，得到n为1，将α从小到大排序得到序列β，
[0091]
β为：{0.0,0.3,0.4,0.5,1.0,1.5}；e(β)＝0.62
[0092]
因此最靠近均值的项为βm＝β4＝0.5，因此：
[0093]
t＝β4右边n项之和/β4左边n项之和
[0094]
t＝β5/β3＝1.0/0.4＝2.5
[0095]
取β4左边序列为γ，γ为：
[0096]
{0.0,0.3,0.4}
[0097]
e(γ)＝(0+0.3+0.4)/3＝0.23
[0098]
s＝e(γ)
×
t＝0.58
[0099]
当α中的项大于s时，如“e”与第一个“d”的间距为1.0和第二个“d”与第二个“i”的间距1.5，则在这两个字母中间插入空格，由此得到从“hedidit”到“he did it”的转换。
[0100]
本技术的单词提取方法，与现有的聚类方法相比，也具有明显的优势。聚类方法对单词间距进行二分类的过程中，即分成两类的过程中，是需要有两个值a和b，当单词间距靠近a的时候分成a类，靠近b的时候分成b类。当a和b之间差距特别大和差距特别小的时候分类受到影响，而且这种算法计算量比较大，这两个值a和b是需要训练的，但当数据比较极端的情况下训练的时候效果会不理想，而且训练需要采取一个价值函数，这个价值函数并不好选取。本技术给出的公式是采取一个阈值的方式进行二分类，就是比这个值小的时候就是一类，比这个值大的时候就是一类，计算量小，而且在数据极端的情况下也是可以选取出来的。
[0101]
聚类算法在数据接近高斯分布的时候效果才比较好，聚类算法的a和b的初值选定在数据分布极端的时候非常困难，不适用于大小差别特别大的数据，而且当数据中有异常点(比如特别大或者特别小的点)时，效果会受很大影响，本技术方法在识别的时候由于在字母重叠的时候会有很多字母间距可能被置零，此时会导致聚类算法受到影响。
[0102]
优选的，步骤s106所述的二次识别的方式为：保留nms非极大值抑制算法，通过利用步骤s101所述字母识别子模型中对应的剔除当前最大置信度字母类别的字母识别子模型进行所述二次识别。
[0103]
如附图6所示，按照现有的yolo算法识别出的结果只有“ne do it”，但显然这种识别结果是不正确的，该文本显然应该被识别为“he do it”，因为“he do it”是一个完整的每个单词都存在于字典中的符合语法规范的句子，然而由于书写不规范，该条语句的首字母被现有算法识别出“n”是由于模型识别出该字母是“n”的概率为90％，是“h”的概率为30％，导致概率较低的“h”被非极大值抑制算法舍弃了，然而显然概率为30％的“h”更符合我们期望识别出的结果，因此，通过现有的算法中字母识别子模型可以修正这个问题，不只提供了“ne do it”这个虽然是概率最大但不合理的结果，而且提供了“he do it”这个概率较低但合理的结果，并对两种结果进行排序按优先级顺序进行输出，优先级越高的结果越推荐。
[0104]
总之，上述实施例具有如下优势：
[0105]
1.识别过程中在检测出文本有异常时，可以提供多种可能识别结果，并给出不同结果的优先级，提高了识别的灵活性和准确性，同时可以检测英文文本中可能出现的拼写和语法错误。
[0106]
2.在单词提取算法中，当英文文本书写产生歪斜时，即书写偏离水平方向程度较大时，在计算字母间隔时考虑到两个字母可能在y轴上间隔较远，因此在计算字母间隔时在所述歪斜程度不同的情况下，结合字母在二维平面上的位置信息，使用了不同方法计算相邻字母间隔，提高了单词划分的准确性。
[0107]
3.由于yolo算法中使用nms非极大值抑制算法导致yolo算法中对于特定对象识别的结果只保留唯一最大置信度的识别结果，在用于识别手写英文文本时，存在特殊字母之间相似度极高，如：字母“h”与字母“n”、字母“g”与字母“q”、字母“i”与字母“l”等。目前深度学习算法对于手写英文文本识别任务识别结果唯一，易造成由于手写文本的不规范书写而识别不准确或识别不灵活的负面影响，例如：对单词“he”因文本本身书写不规范而只输出了识别出“ne”的识别结果。因此当识别出文本存在异常单词不被包含于词典中时，将所述异常单词中所有字母进行单独提取并进行二次识别，对异常单词中的字母的进行二次识别得到的其他可能识别结果与初次识别结果进行比较可以减小所述负面影响。
[0108]
4.经过实测发现通过弃用或改进nms非极大值抑制算法获得其他可能识别结果及其置信度的方法会导致对单个目标的识别框过多，且识别结果由于具有最大置信度的字母类别存在会影响小于最大置信度的字母类别识别效果，因此保留(non-maximum suppression)nms非极大值抑制算法且通过利用步骤s101所述字母识别子模型中对应的剔除当前最大置信度字母类别的字母识别子模型进行所述二次识别可提高二次识别的准确性。
[0109]
5.构建的yolo模型结构激活函数的选择将有便于该方法在便携式设备如fpga上
的实现，对于大于0的x的数据(二进制)保持原样，对于小于0的x的数据(二进制)只需要向右移动三位即可，同时将卷积运算和批标准化合并将减小模型权重和偏置的规模，减少模型在部署时的量化难度，也可加快推理速度。
[0110]
以上详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种等同变换，这些等同变换均属于本发明的保护范围。

技术特征：
1.一种基于神经网络的手写英文文本识别方法，其特征在于：包括以下步骤：s101、获取包括所有种类英文字母的手写英文文本数据集作为母数据集；依序从所述母数据集中剔除某一英文字母，构建若干个子数据集；以所述母数据集和子数据集作为训练数据，采用yolo算法训练得到字母识别母模型和若干个字母识别子模型；s102、获取包含以句子为单位的具有语法错误的非手写英文文本数据集，采用lstm算法训练得到语法判断模型；s103、获取包含预定数量单词的词典，构建词典模块。2.如权利要求1所述的一种基于神经网络的手写英文文本识别方法，其特征在于：还包括：s104、获取手写英文文本测试图片，采用所述字母识别母模型进行识别，将识别结果利用预置的单词提取算法进行处理，得到单词初次识别结果，并形成文本初次识别结果；s105、采用词典模块判断单词初次识别结果是否都存在于词典中，如有不存在于词典中的单词，则判断单词初次识别结果中具有异常情况，并将不存在于词典中的单词标记为异常单词；s106、将所述异常单词从图片中裁剪出来，利用所述若干个字母识别子模型分别进行识别，得到异常单词的多个单词二次识别结果，并利用单词二次识别结果对所述初次识别结果进行替换，得到若干个文本二次识别结果；s107、采用所述词典模块检验依次检验文本二次识别结果，将文本二次识别结果分为单词均存在的文本二次识别结果和单词非均存在的文本二次识别结果，采用所述语法判断模型将单词均存在的文本二次识别结果分为符合语法规范的文本二次识别结果和不符合语法规范的文本二次识别结果；s108、将所有识别结果进行优先级排序：所述符合语法规范的文本二次识别结果＞所述文本初次识别结果＞所述不符合语法规范的文本二次识别结果＞所述单词非均存在的文本二次识别结果；将所有识别结果按所述优先级由高到低顺序输出。3.如权利要求2所述的一种基于神经网络的手写英文文本识别方法，其特征在于：步骤s101中构建若干个子数据集的过程为：采集识别时会发生混淆情况的至少两个字母，构建易混淆字母集；每次从母数据集中分别剔除易混淆字母集中的一个字母，构建除已剔除字母外的其他字母组成子数据集。4.如权利要求2所述的一种基于神经网络的手写英文文本识别方法，其特征在于：步骤s101、所述基于yolo算法的模型结构中的卷积层包含运算有：卷积运算、批标准化以及激活函数，在生成权重和偏置数据用于推理时，将卷积和批标准化合并加快推理速度，激活函数y为：x为函数输入，y为函数输出。5.如权利要求2所述的一种基于神经网络的手写英文文本识别方法，其特征在于：步骤s104所述单词提取算法具体步骤如下：
s201：yolo算法输出的识别目标框的信息包括：识别目标框中心点位置、识别目标框长和宽、识别目标类别以及置信度，根据中心点在y轴位置确定位于同一行的识别目标，根据中心点的x轴位置大小将识别对象从左至右排序得到字符序列，该字符序列为等待单词分割的英文语句，同时利用所述识别目标框信息求得字母间距。6.如权利要求5所述的一种基于神经网络的手写英文文本识别方法，其特征在于：求字母间距的步骤为：计算相邻字母识别框之间在y轴方向上的重叠度；重叠度大于第一阈值时，字母间距等于右字母识别框左边x轴位置减去左字母识别框右边x轴位置；重叠度大于第二阈值且小于第一阈值时，字母间距等于右字母识别框左边x轴位置减去左字母识别框右边x轴位置的值除以两个边框中心点位置连线与x轴夹角的cos函数的值；重叠度小于第二阈值时，字母间距等于两识别框中心点间距减去两识别框在x轴上宽度之和的二分之一。s202：利用s201所述字符序列信息需要对字符中添加空格使其变成实际文本内容。7.如权利要求6所述的一种基于神经网络的手写英文文本识别方法，其特征在于：添加空格的过程为：利用s201所述字母间距，对字母间距大于s的位置加入空格，用数学的方式表达为：s＝e(γ)
×
t，β为所有字母间距从小到大排列的序列，β
m
为最接近序列β平均值的β中的项，n为β项数除4后向下取整，i为自然数，γ为β中β
m
左边所有项新构成的子序列，e(γ)为γ求均值。8.如权利要求7所述的一种基于神经网络的手写英文文本识别方法，其特征在于：步骤s106中所述二次识别方法为：采取保留nms非极大值抑制算法且通过利用所述字母识别子模型中对应的剔除当前最大置信度字母类别的字母识别子模型进行所述二次识别。

技术总结
本发明提供一种基于神经网络的手写英文文本识别方法，具体包括：获取数据集并训练得到字母识别母模型与字母识别子模型；训练得到语法判断模型；构建词典模块；利用字母识别母模型以及单词提取算法得到初次识别结果；利用词典模块判断测试图片中单词是否全部存在；将不存在的单词利用字母识别子模型识别得到其它识别结果；利用词典模块和语法判断模型对其他识别结果进行分类；对所有识别结果进行优先级排序。本发明在保留YOLO中的NMS非极大值抑制算法的同时，可输出多种可能识别结果，同时应用新的单词提取算法实现了对识别结果中单词的划分，为手写英文文本识别任务提供了一种新方法，大大提高了识别的准确性和灵活性。大大提高了识别的准确性和灵活性。大大提高了识别的准确性和灵活性。

技术研发人员：李丽倪杨傅玉祥何书专李伟
受保护的技术使用者：南京大学
技术研发日：2022.04.25
技术公布日：2022/7/5

转载请注明原文地址: https://www.8miu.com/read-3429.html

专利

最新回复(0)