语音应答方法、装置、存储介质、电子设备及车辆与流程

allin2025-05-30 204

本公开涉及终端，具体地，涉及一种语音应答方法、装置、存储介质、电子设备及车辆。

背景技术：

1、随着人工智能技术和自然语言处理技术的发展，智能问答系统应运而生。基于智能问答系统的语音交互方式简单高效，目前已广泛应用于金融、教育、医疗、客服、个人语音助手等场景。

2、相关技术中，智能问答系统获取用户的语音提问信息，通过对该语音提问信息进行处理，获取用户的提问意图信息，进而针对用户的提问意图信息，从用于存储提问意图信息和文本答复信息的知识库中，获取该提问意图信息对应的文本答复信息，然后按照固定的tts(text to speech，文本转语音)语音播报该文本答复信息，但是对于不同的人群来说，智能设备播报的不同语音内容的机械式语音，不能够完全匹配用户的节奏，导致语音播报内容过于单一。

技术实现思路

1、本公开的目的是提供一种语音应答方法、装置、存储介质、电子设备及车辆，其目的是为了丰富语音播报形式，满足目标对象的个性化需求，提升目标对象的满意度。

2、为了实现上述目的，第一方面，本公开提供一种语音应答方法，所述方法包括：

3、获取用户输入的语音信息；

4、根据所述语音信息，确定所述用户输入所述语音信息时的语音描述信息，其中，所述语音描述信息至少包括所述用户的情绪、语速和语言类型中的一种或多种；

5、根据所述语音描述信息，输出所述语音信息对应的应答语音信息。

6、可选地，所述根据所述语音描述信息，输出所述语音信息对应的应答语音信息包括：

7、在所述语音描述信息至少包括所述用户的情绪的情况下，根据所述用户的情绪，确定所述应答语音信息对应的目标情绪；

8、按照所述目标情绪，输出所述应答语音信息。

9、可选地，所述根据所述语音描述信息，输出所述语音信息对应的应答语音信息包括：

10、在所述语音描述信息至少包括所述用户的语速和语言类型的情况下，按照所述用户的语速和语言类型，输出所述应答语音信息。

11、可选地，所述根据所述语音信息，确定所述用户输入所述语音信息时的语音描述信息包括：

12、将所述语音信息，作为预先训练的语音识别模型的输入，得到所述语音识别模型输出的所述语音描述信息。

13、可选地，所述根据所述语音描述信息，输出所述语音信息对应的应答语音信息包括：

14、根据所述语音描述信息，确定语音应答模型；

15、将所述语音信息对应的应答信息输入所述语音应答模型，得到所述语音应答模型输出的应答语音信息，并输出所述应答语音信息。

16、可选地，所述情绪包括多个情绪标识，所述语言类型包括多个语言标识；所述根据所述语音描述信息，确定语音应答模型包括：

17、分别确定所述多个情绪标识对应的第一特征权重，以及所述多个语言标识对应的第二特征权重；

18、将多个所述第一特征权重中权重值最大的作为第一目标特征权重，以及将多个所述第二特征权重中权重值最大的作为第二目标特征权重；

19、根据所述第一目标特征权重和所述第一目标特征权重对应的目标情绪标识，以及所述第二目标特征权重和所述第二目标特征权重对应的目标语言标识，确定语音应答模型。

20、可选地，所述第一目标特征权重对应的目标情绪标识通过以下方式确定：

21、在确定存在多个所述第一目标特征权重的情况下，将首次确定的第一目标特征权重对应的情绪标识作为所述目标情绪标识；

22、所述第二目标特征权重对应的目标语言标识通过以下方式确定：

23、在确定存在多个所述第二目标特征权重的情况下，将首次确定的第二目标特征权重对应的语言标识作为所述目标语言标识。

24、可选地，所述根据所述第一目标特征权重和所述第一目标特征权重对应的目标情绪标识，以及所述第二目标特征权重和所述第二目标特征权重对应的目标语言标识，确定语音应答模型包括：

25、在确定第一目标特征权重对应的目标情绪标识为第一预设情绪标识的情况下，根据所述第一目标特征权重和所述第一目标特征权重对应的目标情绪标识，以及所述第二目标特征权重和所述第二目标特征权重对应的目标语言标识，确定语音应答模型；或者，

26、在确定第一目标特征权重对应的目标情绪标识为第二预设情绪标识的情况下，根据预设情绪补偿对应关系，确定所述目标情绪标识对应的目标情绪补偿标识；以及根据所述第一目标特征权重和所述目标情绪补偿标识，以及所述第二目标特征权重和所述目标语言标识，确定语音应答模型。

27、可选地，所述语音识别模型通过以下方式预先训练得到：

28、获取样本语音信息和样本语音描述信息；

29、将所述样本语音信息输入预设识别模型，得到所述预设识别模型输出的语音描述结果；

30、根据所述语音描述结果和所述样本语音描述信息，确定所述预设识别模型对应的识别参数；

31、根据所述识别参数和所述预设识别模型，确定所述语音识别模型。

32、第二方面，本公开提供一种语音应答装置，所述装置包括：

33、获取模块，用于获取用户输入的语音信息；

34、确定模块，用于根据所述语音信息，确定所述用户输入所述语音信息时的语音描述信息，所述语音描述信息至少包括所述用户的情绪、语速和语言类型中的一种或多种；

35、输出模块，用于根据所述语音描述信息，输出所述语音信息对应的应答语音信息。

36、可选地，所述输出模块，用于在所述语音描述信息至少包括所述用户的情绪的情况下，根据所述用户的情绪，确定所述应答语音信息对应的目标情绪；按照所述目标情绪，输出所述应答语音信息。

37、可选地，所述输出模块，用于在所述语音描述信息至少包括所述用户的语速和语言类型的情况下，按照所述用户的语速和语言类型，输出所述应答语音信息。

38、可选地，所述确定模块用于将所述语音信息，作为预先训练的语音识别模型的输入，得到所述语音识别模型输出的所述语音描述信息。

39、可选地，所述输出模块包括：

40、第一确定子模块，用于根据所述语音描述信息，确定语音应答模型；

41、第一出子模块，用于将所述语音信息对应的应答信息输入所述语音应答模型，得到所述语音应答模型输出的应答语音信息，并输出所述应答语音信息。

42、可选地，所述情绪包括多个情绪标识，所述语言类型包括多个语言标识；所述第一确定子模块用于分别确定所述多个情绪标识对应的第一特征权重，以及所述多个语言标识对应的第二特征权重；

43、将多个所述第一特征权重中权重值最大的作为第一目标特征权重，以及将多个所述第二特征权重中权重值最大的作为第二目标特征权重；

44、根据所述第一目标特征权重和所述第一目标特征权重对应的目标情绪标识，以及所述第二目标特征权重和所述第二目标特征权重对应的目标语言标识，确定语音应答模型。

45、可选地，所述第一目标特征权重对应的目标情绪标识通过以下方式确定：

46、在确定存在多个所述第一目标特征权重的情况下，将首次确定的第一目标特征权重对应的情绪标识作为所述目标情绪标识；

47、所述第二目标特征权重对应的目标语言标识通过以下方式确定：

48、在确定存在多个所述第二目标特征权重的情况下，将首次确定的第二目标特征权重对应的语言标识作为所述目标语言标识。

49、可选地，所述第一确定子模块用于在确定第一目标特征权重对应的目标情绪标识为第一预设情绪标识的情况下，根据所述第一目标特征权重和所述第一目标特征权重对应的目标情绪标识，以及所述第二目标特征权重和所述第二目标特征权重对应的目标语言标识，确定语音应答模型；或者，

50、在确定第一目标特征权重对应的目标情绪标识为第二预设情绪标识的情况下，根据预设情绪补偿对应关系，确定所述目标情绪标识对应的目标情绪补偿标识；以及根据所述第一目标特征权重和所述目标情绪补偿标识，以及所述第二目标特征权重和所述目标语言标识，确定语音应答模型。

51、可选地，所述语音识别模型通过以下方式预先训练得到：

52、获取样本语音信息和样本语音描述信息；

53、将所述样本语音信息输入预设识别模型，得到所述预设识别模型输出的语音描述结果；

54、根据所述语音描述结果和所述样本语音描述信息，确定所述预设识别模型对应的识别参数；

55、根据所述识别参数和所述预设识别模型，确定所述语音识别模型。

56、第三方面，本公开提供一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述第一方面所述的方法的步骤。

57、第四方面，本公开提供一种电子设备，包括：

58、存储器，其上存储有计算机程序；

59、处理器，用于执行所述存储器中的所述计算机程序，以实现上述第一方面所述的方法的步骤。

60、第五方面，本公开提供一种车辆，包括上述第四方面所述的电子设备。

61、按照上述技术方案，通过获取用户输入的语音信息；根据所述语音信息，确定所述用户输入所述语音信息时的语音描述信息，所述语音描述信息至少包括所述用户的情绪、语速和语言类型中的一种或多种；根据所述语音描述信息，输出所述语音信息对应的应答语音信息。这样可以在获取到用户输入的语音信息的情况下，关注用户输入所述语音信息时的语音描述信息，能够随着不同用户的语音描述信息，采取对应的语音播报方式，丰富了语音播报形式，满足了用户的个性化需求，提升了用户的满意度。

62、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

技术特征：

1.一种语音应答方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述语音描述信息，输出所述语音信息对应的应答语音信息包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述语音描述信息，输出所述语音信息对应的应答语音信息包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述语音信息，确定所述用户输入所述语音信息时的语音描述信息包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述语音描述信息，输出所述语音信息对应的应答语音信息包括：

6.根据权利要求5所述的方法，其特征在于，所述情绪包括多个情绪标识，所述语言类型包括多个语言标识；所述根据所述语音描述信息，确定语音应答模型包括：

7.根据权利要求6所述的方法，其特征在于，所述第一目标特征权重对应的目标情绪标识通过以下方式确定：

8.根据权利要求6所述的方法，其特征在于，所述根据所述第一目标特征权重和所述第一目标特征权重对应的目标情绪标识，以及所述第二目标特征权重和所述第二目标特征权重对应的目标语言标识，确定语音应答模型包括：

9.根据权利要求4-8中任一项所述的方法，其特征在于，所述语音识别模型通过以下方式预先训练得到：

10.一种语音应答装置，其特征在于，所述装置包括：

11.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-9中任一项所述方法的步骤。

12.一种电子设备，其特征在于，包括：

13.一种车辆，其特征在于，包括权利要求12所述的电子设备。

技术总结
本公开涉及一种语音应答方法、装置、存储介质、电子设备及车辆，所述方法包括：获取用户输入的语音信息；根据所述语音信息，确定所述用户输入所述语音信息时的语音描述信息，所述语音描述信息至少包括所述用户的情绪、语速和语言类型中的一种或多种；根据所述语音描述信息，输出所述语音信息对应的应答语音信息。

技术研发人员：黎书德,申众,赵伟
受保护的技术使用者：比亚迪股份有限公司
技术研发日：
技术公布日：2024/10/31

转载请注明原文地址: https://www.8miu.com/read-21631.html

专利

最新回复(0)