用于作业提交的文本清晰度增强方法、装置、设备及介质与流程

allin2025-02-13  86


本发明涉及图像处理,尤其涉及一种用于作业提交的文本清晰度增强方法、装置、设备及介质。


背景技术:

1、自动化作业提交正在逐渐成为一种主流工具,特别是在远程教育和大规模课堂管理中,通过自动处理学生提交的作业图像,将手写或打印的文本转化为可识别的数字内容,这种自动化作业提交的核心功能是图像识别技术,它依赖于图像的清晰度和对比度来准确提取文本信息。在传统的作业提交方式中,教师需要手动批改每一份作业,耗时耗力,自动化作业提交通过图像处理和文本识别技术,极大地提高了作业提交的效率,特别是在面对大量作业时,能够快速处理和反馈结果;然而,自动化作业提交有效性在很大程度上取决于上传作业图像的质量。如果图像模糊、对比度不足,就无法准确识别文本,导致错误的评估结果,甚至需要教师进行人工干预,反而增加了工作量。因此,在自动化作业提交背景下,改善图像的清晰度和对比度,确保文本的可读性,不仅能保障系统的识别准确性,还能减少教师的后期修正工作,提升整个作业提交和评估过程的效率和公平性,这一优化对于推动教育信息化、提高教育质量具有重要意义。

2、现有中国专利cn113076952a公开了一种文本自动识别和增强的方法及装置,包括:获取输入的文本图像;将所述文本图像进行图像预处理,得到所述文本图像的预处理图像;采用susan角点检测方法对所述预处理图像进行角点检测,得到字符区域;对所述字符区域计算清晰度评估值,将所述清晰度评估值小于预设阈值的字符区域确定为模糊字符区域;采用ocr对所述模糊字符区域进行字符识别,得到文本字符;对所述文本字符进行增强,得到完整清晰的文本图像。上述专利虽然公开了对文本区域进行图像增强从而增强清晰度,但并未直接改善文本图像的清晰度和对比度,由于它主要依赖ocr技术来识别和增强模糊字符区域,而不是针对整个图像的整体清晰度和对比度进行调整,这可能导致在文本图像整体质量较差的情况下,无法有效增强文本的可读性。此外,对于清晰但对比度较低的文本区域,这一方案也难以提高对比度,从而提升文本的视觉清晰度和易读性。

3、为此,如何改善提交的作业图像的清晰度和对比度,增强文本可读性是亟待解决的问题。


技术实现思路

1、有鉴于此,本发明提供了一种用于作业提交的文本清晰度增强方法、装置、设备及介质,用以解决现有技术中无法改善提交的作业图像的清晰度和对比度,文本可读性差的问题。

2、本发明采用的技术方案是:

3、第一方面,本发明提供了一种用于作业提交的文本清晰度增强方法,所述方法包括:

4、s1:获取学习陪护场景下目标对象提交的实时作业图像;

5、s2:对所述实时作业图像进行平滑处理和边缘检测,输出目标图像;

6、s3:对所述目标图像进行文本区域识别,输出文本区域位置信息;

7、s4:依据所述文本区域位置信息,将文本区域分为文字区域和背景区域,根据文字区域和背景区域之间的对比度特征,确定颜色填充策略为将文字区域对应的第一灰度均值调整至第三灰度均值,和/或,将背景区域对应的第二灰度均值调整至第四灰度均值,其中,第三灰度均值和第四灰度均值根据文字区域对应的第一占比和背景区域的第二占比确定;

8、s5:依据所述文本区域位置信息,利用所述颜色填充策略,对文本区域进行清晰度增强处理,输出增强后的作业图像。

9、优选地,所述s3包括:

10、s31:利用预设的边缘检测算法,对所述目标图像进行处理,确定边缘图像;

11、s32:对边缘图像中各边缘像素点进行邻域检测,确定目标像素点集合;

12、s33:计算所述目标像素点集合的外接矩形,确定所述文本区域位置信息,其中,文本区域包括文字和背景。

13、优选地,所述s32包括:

14、s321:依据预设的多个检测方向,判断当前边缘像素点周围是否存在其他边缘像素点;

15、s322:若当前边缘像素点周围存在其他边缘像素点,则当前边缘像素点为目标像素点,将当前边缘像素点输出至目标像素点集合;

16、s323:若当前边缘像素点周围不存在其他边缘像素点,则当前边缘像素点不为目标像素点。

17、优选地,所述s4包括:

18、s41:依据所述文本区域位置信息,将文本区域分为文字区域和背景区域;

19、s42:对所述文字区域和背景区域进行灰度均值计算,确定文字区域对应的第一灰度均值和背景区域对应的第二灰度均值;

20、s43:依据第一灰度均值和第二灰度均值的差值,确定文字区域和背景区域之间的对比度特征;

21、s44:依据所述对比度特征,确定颜色填充策略。

22、优选地,所述s44包括:

23、s441:获取预设的对比度阈值;

24、s442:将所述对比度特征与所述对比度阈值进行比较,若对比度特征大于所述对比度阈值,则颜色填充策略为不进行颜色填充;

25、s443:若对比度特征小于等于所述对比度阈值,则颜色填充策略为将第一灰度均值调整至第三灰度均值,和/或,将第二灰度均值调整至第四灰度均值,其中,第三灰度均值大于所述第一灰度均值,第二灰度均值大于所述第四灰度均值。

26、优选地,所述s443包括:

27、s4431:依据文字区域中各像素点的第一像素点数量和背景区域中各像素点的第二像素点数量,确定文字区域对应的第一占比和背景区域的第二占比;

28、s4432:依据所述第一占比和第二占比,确定第一初始灰度值区间和第二初始灰度值区间;

29、s4433:依据所述对比度阈值,从所述第一初始灰度值区间和第二初始灰度值区间选择满足条件的若干初始灰度值组合,每一初始灰度值组合包括第一初始灰度值和第二初始灰度值,不同初始灰度值组合的第一初始灰度值和第二初始灰度值不同,每一初始灰度值组合中第一初始灰度值和第二初始灰度值之间的差值均大于等于对比度阈值;

30、s4434:依据所述第一初始灰度值和所述第二初始灰度值,结合所述对比度特征,确定对比度相关的第一评分值;

31、s4435:获取预设的灰度值对应的最大调整值,依据所述最大调整值、所述第一初始灰度值和所述第二初始灰度值,结合所述第一灰度均值和第二灰度均值,确定与视觉舒适度相关的第二评分值;

32、s4436:依据预设权重系数,对所述第一评分值和所述第二评分值进行加权求平均处理,确定总评分值;

33、s4437:将最高总评分值对应的第一初始灰度值作为所述第三灰度均值,将最高总评分值对应的第二初始灰度值作为所述第四灰度均值。

34、优选地,所述s5包括:

35、s51:依据所述颜色填充策略,对文本区域进行处理,确定调整后各目标像素点对应的目标灰度值;

36、s52:获取文字区域中各目标像素点的目标位置信息,对各目标灰度值进行均值计算,确定目标灰度均值;

37、s53:依据所述目标灰度均值和所述目标位置信息,将各目标像素点的目标灰度值均调整为所述目标灰度均值。

38、第二方面,本发明提供了一种用于作业提交的文本清晰度增强装置,所述装置包括:

39、作业图像获取模块,用于获取学习陪护场景下目标对象提交的实时作业图像;

40、预处理模块,用于对所述实时作业图像进行平滑处理和边缘检测,输出目标图像;

41、文本区域识别模块,用于对所述目标图像进行文本区域识别,输出文本区域位置信息;

42、颜色填充策略获取模块,用于依据所述文本区域位置信息,将文本区域分为文字区域和背景区域,根据文字区域和背景区域之间的对比度特征,确定颜色填充策略为将文字区域对应的第一灰度均值调整至第三灰度均值,和/或,将背景区域对应的第二灰度均值调整至第四灰度均值,其中,第三灰度均值和第四灰度均值根据文字区域对应的第一占比和背景区域的第二占比确定;

43、颜色填充模块,用于依据所述文本区域位置信息,利用所述颜色填充策略,对文本区域进行清晰度增强处理,输出增强后的作业图像。

44、第三方面,本发明实施例还提供了一种电子设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。

45、第四方面,本发明实施例还提供了一种存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。

46、综上所述,本发明的有益效果如下:

47、本发明提供的用于作业提交的文本清晰度增强方法、装置、设备及介质,所述方法包括:获取学习陪护场景下目标对象提交的实时作业图像;对所述实时作业图像进行平滑处理和边缘检测,输出目标图像;对所述目标图像进行文本区域识别,输出文本区域位置信息;依据所述文本区域位置信息,将文本区域分为文字区域和背景区域,根据文字区域和背景区域之间的对比度特征,确定颜色填充策略为将文字区域对应的第一灰度均值调整至第三灰度均值,和/或,将背景区域对应的第二灰度均值调整至第四灰度均值,其中,第三灰度均值和第四灰度均值根据文字区域对应的第一占比和背景区域的第二占比确定;依据所述文本区域位置信息,利用所述颜色填充策略,对文本区域进行清晰度增强处理,输出增强后的作业图像。本发明首先对图像进行平滑处理,减少图像中的噪声,抑制不必要的细节,确保后续的边缘检测更加准确,接下来,对经过平滑处理的图像执行边缘检测,通过边缘检测,明确区分文本区域与背景区域,确保文本轮廓的清晰度,这确保了文本区域在图像中得以准确识别,并为后续的文本区域识别和增强处理奠定了基础,在文本区域识别过程中,准确定位文本区域的位置,确保后续的处理集中在这些关键区域,然后,基于识别出的文本区域位置信息,应用预设的颜色填充策略,这些策略包括调整文本区域的颜色对比度,增加文本与背景的差异,使文本更加清晰突出,最终,通过这些步骤,能够有效提高文本区域的清晰度和对比度,使文本在提交的作业图像中更加易于阅读,这种处理方法能够显著提升文本的可读性,确保学生的作业能够被准确、清晰地展示和评估。


技术特征:

1.一种用于作业提交的文本清晰度增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的用于作业提交的文本清晰度增强方法,其特征在于,所述s3包括:

3.根据权利要求2所述的用于作业提交的文本清晰度增强方法,其特征在于,所述s32包括:

4.根据权利要求1所述的用于作业提交的文本清晰度增强方法,其特征在于,所述s4包括:

5.根据权利要求4所述的用于作业提交的文本清晰度增强方法,其特征在于,所述s44包括:

6.根据权利要求5所述的用于作业提交的文本清晰度增强方法,其特征在于,所述s443包括:

7.根据权利要求1所述的用于作业提交的文本清晰度增强方法,其特征在于,所述s5包括:

8.一种用于作业提交的文本清晰度增强装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7中任一项所述的方法。

10.一种存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。


技术总结
本发明涉及图像处理技术领域,解决了现有技术中无法改善提交的作业图像的清晰度和对比度,文本可读性差的问题,提供了一种用于作业提交的文本清晰度增强方法、装置、设备及介质。该方法包括:获取学习陪护场景下目标对象提交的实时作业图像;对实时作业图像进行平滑处理和边缘检测,输出目标图像;对目标图像进行文本区域识别,输出文本区域位置信息;依据所述文本区域位置信息,将文本区域分为文字区域和背景区域,根据文字区域和背景区域之间的对比度特征,确定颜色填充策略;依据文本区域位置信息,利用颜色填充策略,对文本区域进行清晰度增强处理,输出增强后的作业图像。本发明能够改善提交的作业图像的清晰度和对比度,增强文本可读性。

技术研发人员:熊章,陈辉,张智,张青军,杜沛力,胡国湖
受保护的技术使用者:宁波星巡智能科技有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-18540.html

最新回复(0)