1.本发明属于语音识别以及中文自然语言信息处理技术领域,具体而言涉及一种专业领域机器人的问答方法及系统。
背景技术:2.人机语音交互系统的研究目前已有一定时间的历史,且综合语音识别、中文自然语言处理等人工智能技术,逐渐成为人工智能领域的研究重点和研究热点。而随着人们日益增长的个性化需求与专业领域知识普及的必要性,面向专业领域知识的机器人问答系统是当下人机交互中的重要分支内容。例如,随着人口老龄化的加重以及对医疗智能化服务的需求,在各大医院中常常会出现患者对医院结构、挂号科目、路线问询以及疾病护理等提出相关问题。而这些问题通常需要一定的知识储备才能回答相关内容。而目前这一类问题的回答还是通过人工问询的方式,该方式主要面临着以下这些问题:大部分病人的问询内容大体一致,而重复性工作浪费医院的人力、财力和相应的时间资源;此外,在医院人流量大的情况下,人工问询的方式难以兼顾所有患者的问题,从而导师患者满意度下降。在这样的时代背景下,随着语音识别以及中文自然语言信息处理技术的发展与研究,专业领域机器人的问答系统就变得尤为重要。
3.现在市面上已有一些相应的机器人问答系统,目前该类机器人的问答系统通常是以文字的形式进行输入,用户需要在交互界面中输入相应的文字来实现问题的检索与回答,这样为用户的使用带来了一定的不便利性,且由于输入相应文字所耗费的时间较长,容易造成使用该系统的用户长时间滞留在界面前,无法实现快速便捷化服务。
4.此外,目前大多数的机器人问答服务在面向相关机构时无法对问答系统的知识库进行改变,相当于用户无法对问答系统的知识库进行更新与修改,这样会导致知识库的内容随着时间的变化而陈旧,无法为用户提供与时俱进的相应问答服务。
5.现有一种基于对话机器人的招生自动问答方法及系统(cn 105677822 a),所述方法首先获取用户输入的文字;其次对所述用户输入的文字进行文字处理;再者根据进行文字处理后的文字,利用模糊匹配方法和内部推理机制从知识库中选择最佳答案;最后将所述最佳答案发送给用户。但是并未提供一种可供用户直接以人类语音作为沟通媒介形式进行交互的方法。
技术实现要素:6.针对以上传统问答系统的弊病,本发明提供一种专业领域机器人的问答方法及系统,本发明的技术方案针对专业领域的问答系统,让用户可以自由地定义问答系统的领域知识库,并且通过语音交互的形式帮助用户得到更好的人机交互体验,以实现可更新知识库与语音交互的功能。
7.本发明至少通过如下技术方案之一实现。
8.一种专业领域机器人的问答方法,所述方法包括以下步骤:
9.1)将用户的语音输入转化为计算机可处理的音频信号;
10.2)将所述音频信号转化为对应的文字;
11.3)对音频转化后获得的文字通过模板匹配从本地应答库中选择最佳应对答案;
12.4)通过匹配得到的最佳答案的文字内容转化为相应的音频信号;
13.5)将音频信号通过扬声器进行语音播报。
14.进一步地,对用户的语音进行处理,包括过滤杂音并将用户的音频流识别为具有时间戳的文字流。
15.进一步地,所述本地应答库为用户所需的专业领域知识内容组成的问答知识库,是以关系型管理系统数据库进行数据管理。
16.进一步地,所述关系型管理系统数据库包括领域本体关键词库、领域本体常见问题库、领域本体标准答案库。
17.进一步地,所述模板匹配是用音频转化后获得的文字进行用户文字流查询,从领域本体标准关键词库中获取各类关键词,对文字流进行模板匹配,当有多个关键词匹配成功时,利用匹配成功的多个关键词在领域本体常见问题库中检索,从而获得所述领域常见问题库中与用户意图近义的表述,利用与用户意图近义表述的内容在领域本体标准答案库中进行检索,进而在领域本体标准答案库中得到相应需要输出内容。
18.进一步地,利用百度ai开放平台,将领域本体标准答案库中得到的文字内容通过语音合成技术转化成语音。
19.进一步地,利用科大讯飞开放平台,将用户语音信息转化为计算机可识别内容。
20.进一步地,所述关系型管理系统数据库为可视化界面,用户根据需求自定义编辑。
21.进一步地,领域本体关键词库与领域本体常见问题库是多对一映射,领域本体常见问题库与领域本体标准答案库是一对一映射。
22.实现所述的一种专业领域机器人的问答方法的系统,包括:
23.用于获取用户语音信息的麦克风阵列模块;
24.用于对用户语音进行识别的语音处理模块;
25.根据专业领域相关知识以关系型管理系统数据库的形式构建的问答知识库;
26.用于进行关键词模板匹配从而在问答知识库中获取最佳答案的答案获取模块;
27.用于将获取的答案通过语音合成的语音播报模块。
28.进一步地,问答知识库的更新包括三个模块,分别是知识数据输入模块、同义句与关键词操作模块、问答库关键词同义词显示模块;
29.所述知识数据输入模块包括用于录入该专业领域相关问答的问题以及回答、用于数据查询。用户可以在问题和回答的输入框分别录入该专业领域相关问答的问题以及回答,当问答库中录入的数据过多而不确定新数据是否已录入的情况下,用户可点击查询从而判断新数据是否之前已录入。而对于已过时的数据,用户可在问答库显示模块中点击相应需要删除数据中的方框,然后点击删除即可。知识数据输入模块的返回键用于用户在完成对问答库编辑完后的操作后,将操作界面切换为原来的模式。
30.所述同义句与关键词操作模块有两项功能:一是为用户提供专业领域知识库编辑界面提示信息:第二个功能则是用户输入相应的关键词与同义句,首先选中需要添加同义句和关键词的相关问题,然后在同义句子和关键词文本框中输入与该问题相关的同义句和
关键词,点击添加即可录入。而若需要更新陈旧的同义句和关键词时,则点击相应同义词和关键词的方框后点击删除即可。
31.问答库关键词同义词显示模块则用于显示问题、回答、关键词、同义词的编号与内容。通过点击某一问题即可在关键词一栏中显示该问题包含的关键词,而点击某一关键词即可在同义词中显示该关键词的同义词。
32.与现有的技术相比,本发明的有益效果为:
33.用户可以直接通过语音沟通的形式与问答系统进行交互,为用户提供快捷方便的语音交互体验;此外,使用该问答系统可以对领域知识进行编辑与更新,从而保证问答系统里的领域知识库是不断在更新的,而且知识库的更新操作简便,无须修改底层设计,提供可视化界面供用户在缺少编程相关基础的情况下也可实现问答系统知识库的更新。
附图说明
34.图1为本发明实施例中用户更新专业领域知识库整体界面图;
35.图2为本发明实施例中专业领域机器人问答系统的流程图;
36.图3为本发明实施例中专业领域机器人问答系统导出数据库的界面图。
37.具体实施方法
38.为了使本技术领域的人员更好地理解本发明方案,以下将结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.实施例1
40.本实施例的一种专业领域机器人的问答系统,包括:
41.用于获取用户语音信息的麦克风阵列模块,由一系列麦克风构成,对获取到的用户语音信息记载为相应的音频流;
42.用于对用户语音进行识别的语音处理模块,利用科大讯飞开放平台技术,对相应记载的音频流识别为具有时间戳的文字流;
43.根据专业领域相关知识以mysql数据库的形式构建的问答知识库,利用关系型管理系统数据库进行数据管理;
44.用于进行关键词模板匹配从而在问答知识库中获取最佳答案的答案获取模块,通过对数据库的数据进行模板匹配法理解用户意图并给出相应回答;
45.用于将获取的答案通过语音合成的语音播报模块,利用百度语音ai开放平台技术对相应回答内容进行语音播报。
46.图1是本发明实施例中用户更新本地专业领域知识库(即本地应答库)整体界面图,由界面图可知,知识库更新界面主要包括三个模块,分别是知识数据输入模块、同义句与关键词操作模块、问答库关键词同义词显示模块。
47.所述知识数据输入模块包括用于录入该专业领域相关问答的问题以及回答、用于数据查询。用户可以在问题和回答的输入框分别录入该专业领域相关问答的问题以及回答,而在录入之后点击插入即可将该问题和回答录入到系统当中。当问答库中录入的数据过多而不确定新数据是否已录入的情况下,用户可点击查询从而判断新数据是否之前已录
入。而对于已过时的数据,用户可在问答库显示模块中点击相应需要删除数据中的方框,然后点击删除即可。知识数据输入模块的返回键用于用户在完成对问答库编辑完后的操作后,将操作界面切换为原来的模式。知识数据输入模块的导出则方便用户将相应的数据导出进行保存。
48.同义句与关键词操作模块主要有两项功能,一是为用户提供专业领域知识库编辑界面提示信息:在修改数据时只需要双击相应的文本框即可进行修改;而各个回答的关键词查看即可在点击相应的回答文本框后,在关键词一栏显示出来,方便用户查看关键词;而每个关键词的同义词查看则通过点击相应的关键词文本框即可实现,从而方便用户对每个关键词的同义词进行编辑和处理。第二个功能则是用户输入相应的关键词与同义句,首先选中需要添加同义句和关键词的相关问题,然后在同义句子和关键词文本框中输入与该问题相关的同义句和关键词,点击添加即可录入。而若需要更新陈旧的同义句和关键词时,则点击相应同义词和关键词的方框后点击删除即可。
49.问答库关键词同义词显示模块则用于显示问题、回答、关键词、同义词的编号与内容。通过点击某一问题即可在关键词一栏中显示该问题包含的关键词,而点击某一关键词即可在同义词中显示该关键词的同义词,通过这样的方式可以使用户在语音交互时即使用不同的词语表达相同的意思来进行询问时,系统也能准确识别并给出标准的回答。
50.实施例2
51.图2是本发明实施例中专业领域机器人问答系统的流程图。具体步骤总结如下:
52.步骤1)、用户在麦克风阵列前进行说话,从而发出相应的语音信息。
53.步骤2)、将用户的语音输入转化为计算机可处理的音频信号,具体包括:利用科大讯飞实时语音转写平台、华为云、百度语音识别等技术对用户的语音进行处理,包括过滤相应的杂音并将用户的音频流识别为具有时间戳的文字流,从而用文字显示相应语音内容。
54.步骤3)、将所述的音频信号转化为对应的文字;
55.步骤4)、对音频转化后获得的文字通过模板匹配法从本地应答库中选择最佳应对答案。
56.所述本地应答库为用户所需的专业领域知识内容组成相应的问答知识库,并且该知识库以mysql数据库进行数据管理,在提高数据灵活性的同时也方便进行管理。
57.步骤5)、将系统通过匹配得到的最佳答案的文字内容转化为相应的音频信号。具体包括:利用百度ai开放平台、中国移动云、迅捷文字转语音等技术,将领域本体标准答案库中得到的文字内容通过语音合成技术转化成语音,实现高度拟人、流畅自然的效果。
58.步骤6)、将步骤5)的音频信号通过扬声器进行语音播报。
59.所述模板匹配:用音频转化后获得的文字进行用户文字流查询,从领域本体标准关键词库中获取各类关键词,对文字流进行模板匹配,当有多个关键词匹配成功时,则检索领域本体常见问题库,从而获得所述领域常见问题库中与用户意图近义表述,进而在领域本体标准答案库中得到相应需要输出内容。
60.实施例3
61.一种专业领域机器人的问答方法,所述方法包括以下步骤:
62.1)将用户的语音输入转化为计算机可处理的音频信号;
63.2)将所述音频信号转化为对应的文字;
64.3)对音频转化后获得的文字通过模板匹配从本地应答库中选择最佳应对答案;所述本地应答库为用户所需的专业领域知识内容组成的问答知识库,是以关系型管理系统数据库进行数据管理。
65.所述关系型管理系统数据库包括领域本体关键词库、领域本体常见问题库、领域本体标准答案库。所述领域本体关键词库与领域本体常见问题库是多对一映射,领域本体常见问题库与领域本体标准答案库是一对一映射。
66.所述关系型管理系统数据库的内容能自定义编辑,且无需在底层代码上进行修改,提供可视化界面方便进行修改。
67.4)通过匹配得到的最佳答案的文字内容转化为相应的音频信号;
68.5)将音频信号通过扬声器进行语音播报。
69.图3是本发明实施例中专业领域机器人问答系统导出数据库的界面图。当用户在使用该系统完成相应的领域常见问题库、领域本体标准词库、领域标准问答库构建后,需要对相应的数据库内容进行导出存档时,则显示为该界面。该界面主要分为两个部分,显示部分与操作部分。在显示部分,该界面的表格中左侧表示目前可供用户保存的相应数据库名称,表格右侧表示用户目前针对这些数据库是否有意欲保存的意图。用户可通过勾选相应的数据库或者点击全选对所有的数据库进行保存并导出。
70.以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
技术特征:1.一种专业领域机器人的问答方法,其特征在于,所述方法包括以下步骤:1)将用户的语音输入转化为计算机可处理的音频信号;2)将所述音频信号转化为对应的文字;3)对音频转化后获得的文字通过模板匹配从本地应答库中选择最佳应对答案;4)通过匹配得到的最佳答案的文字内容转化为相应的音频信号;5)将音频信号通过扬声器进行语音播报。2.根据权利要求1所述的一种专业领域机器人的问答方法,其特征在于,对用户的语音进行处理,包括过滤杂音并将用户的音频流识别为具有时间戳的文字流。3.根据权利要求1所述的一种专业领域机器人的问答方法,其特征在于,所述本地应答库为用户所需的专业领域知识内容组成的问答知识库,是以关系型管理系统数据库进行数据管理。4.根据权利要求3所述的一种专业领域机器人的问答方法,其特征在于,所述关系型管理系统数据库包括领域本体关键词库、领域本体常见问题库、领域本体标准答案库。5.根据权利要求4所述的一种专业领域机器人的问答方法,其特征在于,所述模板匹配是用音频转化后获得的文字进行用户文字流查询,从领域本体标准关键词库中获取各类关键词,对文字流进行模板匹配,当有多个关键词匹配成功时,利用匹配成功的多个关键词在领域本体常见问题库中检索,从而获得所述领域常见问题库中与用户意图近义的表述,利用与用户意图近义表述的内容在领域本体标准答案库中进行检索,进而在领域本体标准答案库中得到相应需要输出内容。6.根据权利要求5所述的一种专业领域机器人的问答方法,其特征在于,利用百度ai开放平台,将领域本体标准答案库中得到的文字内容通过语音合成技术转化成语音。7.根据权利要求1所述的一种专业领域机器人的问答方法,其特征在于,利用科大讯飞开放平台,将用户语音信息转化为计算机可识别内容。8.根据权利要求1所述的一种专业领域机器人的问答方法,其特征在于,所述关系型管理系统数据库为可视化界面,用户根据需求自定义编辑。9.根据权利要求1所述的一种专业领域机器人的问答方法,其特征在于,领域本体关键词库与领域本体常见问题库是多对一映射,领域本体常见问题库与领域本体标准答案库是一对一映射。10.实现权利要求1所述的一种专业领域机器人的问答方法的系统,其特征在于,包括:用于获取用户语音信息的麦克风阵列模块;用于对用户语音进行识别的语音处理模块;根据专业领域相关知识以关系型管理系统数据库的形式构建的问答知识库;用于进行关键词模板匹配从而在问答知识库中获取最佳答案的答案获取模块;用于将获取的答案通过语音合成的语音播报模块。
技术总结本发明公开了一种专业领域机器人的问答方法及系统,所述方法包括以下步骤:用户在麦克风阵列前说话进行语音输入;将用户的语音输入转化为音频信号;将音频信号转化为文字;对音频转化后的文字通过模板匹配法从本地应答库中选择最佳答案;将最佳答案的文字转化为音频信号;将音频信号通过扬声器进行语音播报。实施本发明的有益效果在于,本发明主要针对专业领域,将领域的相关知识库作为问答系统的本地应答库,通过对用户语音的识别理解用户的意图,从而根据用户的意图选择合适的应答内容作出回应,实现智能化程度。并且通过语音识别以及语音播报的形式,给用户带来更好的人机交互体验,从而提高用户对问答系统的满意度。从而提高用户对问答系统的满意度。从而提高用户对问答系统的满意度。
技术研发人员:张智军 邓羡知
受保护的技术使用者:华南理工大学
技术研发日:2022.03.15
技术公布日:2022/7/5