一种适用于多种场景的多轮问答方法、装置及设备与流程

allin2025-02-25  56


本技术涉及自然语言,尤其涉及一种适用于多种场景的多轮问答方法、装置及设备。


背景技术:

1、随着人工智能技术的飞速发展,自然语言处理(natural language processing,nlp)领域取得了显著的进步,特别是大语言模型(large language models,llm)的出现,为nlp领域带来了新的变革。目前,自然语言处理在多轮问答的实现场景中具有较为广泛的应用,当场景较为复杂或用户意图多变的情况下时,用户的意图往往难以通过单一的文本输入准确捕捉,多轮对话则成为了理解用户真实意图和需求的重要手段。

2、传统的nlp方法,如基于语料数据集训练深度学习模型再进行微调以实现多轮问答,尽管能够基于用户输入进行连续的问题回答,但是多轮问答对于场景的适配性往往依赖于训练的适配性。例如,由场景1的训练数据训练得到的多轮问答模型难以适用于场景2的多轮问答任务,如果需要使得多轮问答模型适用于场景2,则需要通过大量场景2的标注数据重新训练多轮问答模型。但是大量数据的获取和模型训练往往是一个耗时且成本高昂的过程。


技术实现思路

1、有鉴于此,本技术提供了一种适用于多种场景的多轮问答方法、装置及设备,旨在提高复杂场景中多轮问答的灵活性和可扩展性,节省了训练的耗时和成本。

2、第一方面,本技术提供了一种适用于多种场景的多轮问答方法,所述方法包括:

3、获取当前轮次输入的自然语言描述;

4、利用大语言模型从多个场景词槽模板确定当前轮次输入的自然语言描述所属的当前场景;所述场景词槽模板定义了场景数据和场景对应的词槽数据;

5、基于所述当前场景对应的场景词槽模板,结合当前轮次输入的自然语言描述,利用大语言模型判断当前场景下所需的词槽数据是否完整;

6、若所述当前场景对应的词槽数据不完整,基于缺失的词槽数据生成第一问答策略,以引导用户在所述当前轮次的后续轮次中补充缺失的词槽数据。

7、可选地,所述基于所述当前场景对应的场景词槽模板,结合当前轮次输入的自然语言描述,利用大语言模型判断当前场景下所需的词槽数据是否完整,包括:

8、基于所述当前场景对应的场景词槽模板,利用大语言模型从所述当前轮次输入的自然语言描述中抽取当前场景相关的实体;

9、根据所述当前场景相关的实体更新当前场景对应的场景词槽模板中的词槽数据变量,得到当前场景更新后的场景词槽模板;

10、利用大语言模型判断当前场景更新后的场景词槽模板对应的词槽数据是否完整。

11、可选地,所述利用大语言模型从多个场景词槽模板确定当前轮次输入的自然语言描述所属的当前场景,包括:

12、获取先前轮次输入的自然语言描述对应的先前场景;所述先前轮次为当前轮次的前一轮次;所述先前轮次输入的自然语言描述对应的先前场景是利用大语言模型从多个场景词槽模板识别得到的;

13、基于先前场景对应的场景词槽模板,利用大语言模型判断当前轮次输入的自然语言描述是否与所述先前场景相关;

14、若所述当前轮次输入的自然语言描述与先前场景不相关,基于当前轮次输入的自然语言描述和先前场景生成第二问答策略,以引导用户在所述当前轮次的后续轮次中确认问答场景。

15、可选地,所述方法还包括:

16、获取用户基于第二问答策略输入的第一自然语言描述;

17、利用大语言模型从多个场景词槽模板确定第一自然语言描述中所属的当前场景;

18、基于当前场景对应的场景变量更新先前场景的场景变量。

19、可选地,所述基于先前场景对应的场景词槽模板,利用大语言模型判断当前轮次输入的自然语言描述是否与所述先前场景相关,包括:

20、利用大语言模型从所述当前轮次输入的自然语言描述中抽取当前轮次输入的自然语言描述中的实体;

21、计算所述当前轮次输入的自然语言描述中的实体与先前场景对应的场景词槽模板中词槽数据的相似度;

22、若所述词槽数据的相似度大于或等于第一预设阈值,则确定所述当前轮次输入的自然语言描述与所述先前场景相关;

23、若所述词槽数据的相似度小于第一预设阈值,则确定所述当前轮次输入的自然语言描述与所述先前场景不相关。

24、可选地,所述若所述当前场景对应的词槽数据不完整,基于缺失的词槽数据生成第一问答策略,包括:

25、利用各场景对应的场景词槽模板中的元素构建初始提示词初始模板和问答策略模板;

26、若所述当前场景对应的词槽数据不完整,根据当前场景对应的场景词槽模板和所述当前轮次输入的自然语言描述确定当前场景缺失的词槽数据,并基于所述当前场景缺失的词槽数据和初始提示词初始模板生成提示词模板;

27、基于所述提示词模板和所述问答策略模板生成第一问答策略。

28、可选地,所述场景词槽模板通过如下方式得到:

29、根据页面组成规则库中的页面类型定义识别待生成场景词槽模板的页面类型;所述页面组成规则库存储了预先设置的页面类型及其对应的固定组成方式;

30、基于页面类型的识别结果,从页面组成规则库中提取对应页面类型的固定组成方式,并根据提取得到的固定组成方式生成相应的场景词槽模板。

31、可选地,所述方法还包括:

32、获取用户基于第一问答策略输入第二自然语言描述;

33、若所述第二自然语言描述中的场景与当前轮次输入的自然语言描述中的场景一致,根据所述当前场景对应的场景词槽模板利用大语言模型从所述第一问答策略对应的自然语言描述中抽取第一问答策略对应的自然语言描述中的实体;

34、根据所述第一问答策略对应的自然语言描述中的实体更新当前场景对应的场景词槽模板中的词槽数据变量,循环直至当前场景对应的词槽数据完整。

35、第二方面,本技术提供了一种适用于多种场景的多轮问答装置,所述装置包括:

36、获取模块,用于获取当前轮次输入的自然语言描述;

37、确定模块,用于利用大语言模型从多个场景词槽模板确定当前轮次输入的自然语言描述所属的当前场景;所述场景词槽模板定义了场景数据和场景对应的词槽数据;

38、判断模块,用于基于所述当前场景对应的场景词槽模板,结合当前轮次输入的自然语言描述,利用大语言模型判断当前场景下所需的词槽数据是否完整;

39、生成模块,用于若所述当前场景对应的词槽数据不完整,基于缺失的词槽数据生成第一问答策略,以引导用户在所述当前轮次的后续轮次中补充缺失的词槽数据。

40、第三方面,本技术提供了一种适用于多种场景的多轮问答设备,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行前述第一方面任一实施方式所介绍的适用于多种场景的多轮问答方法。

41、第四方面,本技术提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一实施方式所介绍的适用于多种场景的多轮问答方法。

42、本技术提供了一种适用于多场景的多轮问答方法、装置及设备。在执行该方法时,首先获取当前轮次输入的自然语言描述;后利用大语言模型从多个场景词槽模板确定当前轮次输入的自然语言描述所属的当前场景;场景词槽模板定义了场景数据和场景对应的词槽数据;然后基于当前场景对应的场景词槽模板,结合当前轮次输入的自然语言描述,利用大语言模型判断当前场景下所需的词槽数据是否完整;最后若当前场景对应的词槽数据不完整,基于缺失的词槽数据生成问答策略,以引导用户在当前轮次的后续轮次中补充缺失的词槽数据。

43、上述方案具有以下有益效果:

44、灵活性,由于使用了大语言模型和场景词槽模板,该方法能够适应多种不同的场景,并根据用户的输入动态调整问答策略。

45、可扩展性,由于场景词槽模板可以定义场景数据和场景对应的词槽数据,因此通过定义场景数据和场景对应的词槽数据就可以在多个场景词槽模板引入新场景,而不需要对系统进行大规模的修改或重新训练,因此节省了训练的耗时和成本。


技术特征:

1.一种适用于多种场景的多轮问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的适用于多种场景的多轮问答方法,其特征在于,所述基于所述当前场景对应的场景词槽模板,结合当前轮次输入的自然语言描述,利用大语言模型判断当前场景下所需的词槽数据是否完整,包括:

3.根据权利要求1所述的适用于多种场景的多轮问答方法,其特征在于,所述利用大语言模型从多个场景词槽模板确定当前轮次输入的自然语言描述所属的当前场景,包括:

4.根据权利要求3所述的适用于多种场景的多轮问答方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的适用于多种场景的多轮问答方法,其特征在于,所述基于先前场景对应的场景词槽模板,利用大语言模型判断当前轮次输入的自然语言描述是否与所述先前场景相关,包括:

6.根据权利要求1所述的适用于多种场景的多轮问答方法,其特征在于,所述若所述当前场景对应的词槽数据不完整,基于缺失的词槽数据生成第一问答策略,包括:

7.根据权利要求1所述的适用于多种场景的多轮问答方法,其特征在于,所述场景词槽模板通过如下方式得到:

8.根据权利要求1所述的适用于多种场景的多轮问答方法,其特征在于,所述方法还包括:

9.一种适用于多种场景的多轮问答装置,其特征在于,所述装置包括:

10.一种适用于多种场景的多轮问答设备,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行前述权利要求1-8任一项所述的适用于多种场景的多轮问答方法。


技术总结
本申请提供了一种适用于多场景的多轮问答方法、装置及设备。首先获取当前轮次输入的自然语言描述;后利用大语言模型从多个场景词槽模板确定当前轮次输入的自然语言描述所属的当前场景;然后基于当前场景对应的场景词槽模板,结合当前轮次输入的自然语言描述,利用大语言模型判断当前场景下所需的词槽数据是否完整;若当前场景对应的词槽数据不完整,基于缺失的词槽数据生成问答策略,以引导用户在当前轮次的后续轮次中补充缺失的词槽数据。通过使用大语言模型和场景词槽模板,能够适应多种不同的场景,且引入新场景时定义相应的场景词槽模板就可以将该方法扩展到新的场景中,而不需要对系统进行大规模的修改或重新训练,节省了训练的耗时和成本。

技术研发人员:倪琳,廖锐,何光宇,金铸,陈禹铭
受保护的技术使用者:东软集团股份有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-18771.html

最新回复(0)