本技术涉及货运,尤其涉及一种长度信息的识别方法及系统。
背景技术:
1、由于在货物运输之前,司机和客户均会进行电话沟通来询问各种长度信息,其中长度信息也可以包括距离信息,比如货车的长度、货物的长宽高以及取货距离等等信息,但是往往会出现司机无法从对话中准确地识别出客户的所表达长度信息所指代的对象,从而导致出现客户取消订单或者是司机出现违规行为等现象,因此如何准确地识别出对话中长度信息所指代的对象尤为重要。
2、在现有的识别技术中,主要通过bert模型结合自然语言处理技术来实现对话的识别,但是现有技术尚未能够很好地适应货物运输领域的对话识别,从而导致即使利用现有技术来识别这一领域的对话,也无法准确地识别出各个长度信息所指代的对象。
技术实现思路
1、基于上述现有技术的不足,本技术提供了一种长度信息的识别方法及系统,以解决现有技术所带来的无法准确地识别出各个长度信息所指代的对象的问题。
2、为了实现上述目的,本技术提供了以下技术方案:
3、本技术第一方面提供了一种长度信息的识别方法,包括:
4、获取录音通话文本;
5、利用长度识别模块对所述录音通话文本进行长度识别,得到所述录音通话文本对应的长度识别结果;其中,所述长度识别模块由uie模型、正则表达式、以及自然语言模型构成;
6、从所述录音通话文本中提取所述长度识别结果对应的上下文内容;
7、根据所述长度识别结果及其对应的上下文内容,构建识别任务;
8、将所述识别任务输入至预先训练好的大模型中,得到所述录音通话文本对应的长度信息及其对应的指代对象;其中,所述大模型预先利用样本录音通话文本对应的样本识别任务进行训练得到。
9、可选地,在上述的长度信息的识别方法中,所述利用长度识别模块对所述录音通话文本进行长度识别,得到所述录音通话文本对应的长度识别结果,包括:
10、将所述录音通话文本分别输入至所述uie模型、所述正则表达式、以及所述自然语言模型中进行长度信息识别,得到所述uie模型输出的第一识别结果、所述正则表达式输出的第二识别结果、以及所述自然语言模型输出的第三识别结果;
11、对所述第一识别结果、所述第二识别结果、以及所述第三识别结果进行预处理,得到所述录音通话文本对应的长度识别结果。
12、可选地,在上述的长度信息的识别方法中,所述对所述第一识别结果、所述第二识别结果、以及所述第三识别结果进行预处理,得到所述录音通话文本对应的长度识别结果,包括:
13、分别对所述第一识别结果、所述第二识别结果、以及所述第三识别结果进行规范化处理;
14、对规范化后的第一识别结果、第二识别结果、以及第三识别结果进行整合处理,得到所述录音通话文本对应的长度识别结果。
15、可选地,在上述的长度信息的识别方法中,所述大模型的训练方法,包括:
16、获取样本录音通话文本;
17、从所述样本录音通话文本中提取样本长度信息及其对应的样本上下文内容;
18、根据所述样本长度信息及其对应的样本上下文内容,构建所述样本录音通话文本对应的样本识别任务;
19、将所述样本识别任务输入至大模型中,得到所述样本长度信息及其对应的样本指代对象;
20、判断所述样本长度信息及其对应的样本指代对象是否均符合实际结果;
21、若所述样本长度信息及其对应的样本指代对象均符合所述实际结果,则将所述大模型确定为训练好的大模型;
22、若所述样本长度信息及其对应的样本指代对象均不符合实际结果,则调整所述大模型的参数,并返回执行所述将所述样本识别任务输入至大模型中,得到所述样本长度信息及其对应的样本指代对象。
23、可选地,在上述的长度信息的识别方法中,所述根据所述长度识别结果及其对应的上下文内容,构建识别任务,包括:
24、按照预设的回答格式,对所述长度识别结果及其对应的上下文内容进行分析,得到回答结果;
25、基于所述回答结果和所述长度识别结果及其对应的上下文内容,构建所述录音通话文本的识别任务。
26、本技术第二方面提供了一种长度信息的识别系统,包括:
27、文本获取单元,用于获取录音通话文本;
28、识别单元,用于利用长度识别模块对所述录音通话文本进行长度识别,得到所述录音通话文本对应的长度识别结果;其中,所述长度识别模块由uie模型、正则表达式、以及自然语言模型构成;
29、提取单元,用于从所述录音通话文本中提取所述长度识别结果对应的上下文内容;
30、构建单元,用于根据所述长度识别结果及其对应的上下文内容,构建识别任务;
31、输入单元,用于将所述识别任务输入至预先训练好的大模型中,得到所述录音通话文本对应的长度信息及其对应的指代对象;其中,所述大模型预先利用样本录音通话文本对应的样本识别任务进行训练得到。
32、可选地,在上述的长度信息的识别系统中,所述识别单元,包括:
33、识别子单元,用于将所述录音通话文本分别输入至所述uie模型、所述正则表达式、以及所述自然语言模型中进行长度信息识别,得到所述uie模型输出的第一识别结果、所述正则表达式输出的第二识别结果、以及所述自然语言模型输出的第三识别结果;
34、预处理单元,用于对所述第一识别结果、所述第二识别结果、以及所述第三识别结果进行预处理,得到所述录音通话文本对应的长度识别结果。
35、可选地,在上述的长度信息的识别系统中,所述预处理单元,包括:
36、处理单元,用于分别对所述第一识别结果、所述第二识别结果、以及所述第三识别结果进行规范化处理;
37、整合单元,用于对规范化后的第一识别结果、第二识别结果、以及第三识别结果进行整合处理,得到所述录音通话文本对应的长度识别结果。
38、可选地,在上述的长度信息的识别系统中,还包括:
39、获取单元,用于获取样本录音通话文本;
40、提取子单元,用于从所述样本录音通话文本中提取样本长度信息及其对应的样本上下文内容;
41、构建子单元,用于根据所述样本长度信息及其对应的样本上下文内容,构建所述样本录音通话文本对应的样本识别任务;
42、输入子单元,用于将所述样本识别任务输入至大模型中,得到所述样本长度信息及其对应的样本指代对象;
43、判断单元,用于判断所述样本长度信息及其对应的样本指代对象是否均符合实际结果;
44、确定单元,用于若所述样本长度信息及其对应的样本指代对象均符合所述实际结果,则将所述大模型确定为训练好的大模型;
45、调整单元,用于若所述样本长度信息及其对应的样本指代对象均不符合实际结果,则调整所述大模型的参数,并返回执行所述将所述样本识别任务输入至大模型中,得到所述样本长度信息及其对应的样本指代对象。
46、可选地,在上述的长度信息的识别系统中,所述构建单元,包括:
47、分析单元,用于按照预设的回答格式,对所述长度识别结果及其对应的上下文内容进行分析,得到回答结果;
48、构建子单元,用于基于所述回答结果和所述长度识别结果及其对应的上下文内容,构建所述录音通话文本的识别任务。
49、本技术提供的一种长度信息的识别方法,通过获取录音通话文本,其次利用长度识别模块对录音通话文本进行长度识别,得到录音通话文本对应的长度识别结果,其中,长度识别模块由uie模型、正则表达式、以及自然语言模型构成,接着从录音通话文本中提取长度识别结果对应的上下文内容,然后根据长度识别结果及其对应的上下文内容,构建识别任务,最后将识别任务输入至预先训练好的大模型中,得到录音通话文本对应的长度信息及其对应的指代对象,其中,大模型预先利用样本录音通话文本对应的样本识别任务进行训练得到。从而通过长度识别模块先识别出长度信息,在查找长度信息的上下文内容,并构建识别任务输入至大模型中,能够准确地识别出长度信息及其指代对象,进而有效地解决了客户取消订单或者是司机出现违规行为等现象的发生。
1.一种长度信息的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述利用长度识别模块对所述录音通话文本进行长度识别,得到所述录音通话文本对应的长度识别结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述第一识别结果、所述第二识别结果、以及所述第三识别结果进行预处理,得到所述录音通话文本对应的长度识别结果,包括:
4.根据权利要求1所述的方法,其特征在于,所述大模型的训练方法,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述长度识别结果及其对应的上下文内容,构建识别任务,包括:
6.一种长度信息的识别系统,其特征在于,包括:
7.根据权利要求6所述的系统,其特征在于,所述识别单元,包括:
8.根据权利要求7所述的系统,其特征在于,所述预处理单元,包括:
9.根据权利要求6所述的系统,其特征在于,还包括:
10.根据权利要求6所述的系统,其特征在于,所述构建单元,包括:
