低功耗语音唤醒系统及方法、电子设备与流程

allin2025-04-05  37


本技术涉及语音唤醒,具体涉及一种低功耗语音唤醒系统及方法、电子设备。


背景技术:

1、语音唤醒是指用户说出唤醒关键词时,设备从睡眠状态切换到工作状态,给出指定响应。语音唤醒技术的作用在于,用户对于设备的操作可以用语音进行,极大方便用户体验,并且设备不需要一直处于工作状态,大幅节省功耗,很多带有语音交互功能的设备都将语音唤醒技术作为入口。语音唤醒技术的应用领域很广,比如机器人、手机、可穿戴设备、智能家居、车载设备等。语音唤醒技术的难点在于兼顾高性能与低功耗,一方面,很多应用语音唤醒技术的设备通常采用电池供电,能源受限,要求语音唤醒功耗越低越好,另一方面,语音唤醒技术作为语音交互的入口,用户对于语音交互的效果要求越来越高,对于语音唤醒技术提出了很高的性能要求。


技术实现思路

1、本发明实施例提供一种低功耗语音唤醒系统及方法、电子设备,可以在保证唤醒关键词识别准确性的同时大大降低系统功耗。

2、一方面,本发明实施例提供一种低功耗语音唤醒系统,所述系统包括:子处理平台、以及主处理平台;

3、所述子处理平台,用于对语音数据进行前级关键词检测,并在检测到可能包含唤醒关键词时,对所述语音数据进行缓存,并唤醒所述主处理平台;

4、所述主处理平台,用于在唤醒后执行后级关键词检测,确定所述子处理平台缓存的语音数据是否包含唤醒关键词。

5、可选地,所述子处理平台,还用于在设定时间或者设定次数内未检测到唤醒关键词时,进入休眠状态。

6、可选地,所述主处理平台,还用于在设定时间或者设定次数内未检测到唤醒关键词时,进入休眠状态,并触发所述子处理平台进入休眠状态。

7、可选地,所述主处理平台,还用于在设定时间或者设定次数内检测到唤醒关键词后,进行语音交互。

8、可选地,所述系统还包括:低功耗信号采集模块、以及低功耗语音活动检测模块;

9、所述低功耗信号采集模块,用于通过低功耗方式采集外界声音得到声音数据,传输所述声音数据至所述低功耗语音活动检测模块;

10、所述低功耗语音活动检测模块,用于对所述声音数据进行语音活动检测,定向缓存声音数据,并在检测到语音后,唤醒所述子处理平台;

11、所述子处理平台对所述低功耗语音活动检测模块缓存的语音数据进行前级关键词检测。

12、可选地,所述低功耗信号采集模块包括:数字麦克风、和/或模拟麦克风,用于为所述低功耗语音活动检测模块提供多种不同来源的声音数据。

13、可选地,所述低功耗语音活动检测模块位于所述低功耗语音唤醒系统中为低功耗设计的专用数字区域。

14、可选地,所述低功耗语音活动检测模块包括:数字接口、数字滤波单元、硬化语音活动检测单元、以及数据存储单元;

15、所述数字接口,用于接收所述低功耗信号采集模块输出的一路或者多路声音数据,对所述声音数据进行选择和/或解析后输出;

16、所述数字滤波单元,用于对所述数字接口的输出数据进行采样率转换和滤波处理,得到低采样率数据;

17、所述硬化语音活动检测单元,用于对所述低采样率数据进行语音活动检测,并在检测到语音后,唤醒所述子处理平台,并将对应的低采样率数据作为语音数据缓存至所述数据存储单元。

18、可选地,所述硬化语音活动检测单元包括:前级语音活动检测单元和后级语音活动检测单元;

19、所述前级语音活动检测单元,用于对所述低采样率数据进行语音活动检测,并在检测到所述低采样率数据可能为语音后,输出所述低采样数据至所述后级语音活动检测单元;

20、所述后级语音活动检测单元,用于对所述前级语音活动检测单元输出的低采样数据进行语音活动检测,并在检测到语音后,唤醒所述子处理平台;

21、所述前级语音活动检测单元还用于在检测到所述低采样率数据可能为语音后,将对应的低采样率数据作为语音数据缓存至所述数据存储单元;或者所述后级语音活动检测单元还用于在检测到语音后,将所述低采样率数据作为语音数据缓存至所述数据存储单元。

22、可选地,所述前级语音活动检测单元的性能和复杂度均低于后级语音活动检测单元的性能和复杂度。

23、可选地,所述低功耗语音活动检测模块、所述子处理平台、以及所述主处理平台的工作采样率相同或者不同。

24、另一方面,本发明实施例还提供一种低功耗语音唤醒方法,所述方法基于子处理平台和主处理平台进行两级唤醒关键词检测;所述方法包括:

25、利用所述子处理平台对语音数据进行前级关键词检测,并在检测到可能包含唤醒关键词时,对所述语音数据进行缓存,并唤醒所述主处理平台;

26、利用所述主处理平台对所述子处理平台缓存的语音数据进行后级关键词检测,确定所述子处理平台缓存的语音数据是否包含唤醒关键词。

27、可选地,所述方法还包括:在前级关键词检测过程中,如果在设定时间或者设定次数内未检测到唤醒关键词,则控制所述子处理平台进入休眠状态。

28、可选地,所述方法还包括:在后级关键词检测过程中,如果在设定时间或者设定次数内未检测到唤醒关键词,则控制所述主处理平台和所述子处理平台进入休眠状态。

29、可选地,所述方法还包括:

30、通过低功耗方式采集外界声音得到声音数据;

31、对所述声音数据进行语音活动检测,定向缓存声音数据,并在检测到语音后,唤醒所述子处理平台。

32、另一方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行前面所述低功耗语音唤醒方法的步骤。

33、另一方面,本发明实施例还提供一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行前面所述低功耗语音唤醒方法的步骤。

34、本发明实施例提供的低功耗语音唤醒系统及方法、电子设备,通过子处理平台和主处理平台实现两级关键词检测,即前级关键词检测和后级关键词检测,在前级检到可能包含唤醒关键词时,对语音数据进行缓存,并唤醒主处理平台,由主处理平台进行后级关键词检测。主处理平台和子处理平台采用不同的检测方法,由子处理平台满足低功耗设计的限制,由主处理平台保证了高精度唤醒关键词检测的可行性,子处理平台与主处理平台配合既提高了唤醒关键词识别的准确性,同时降低了整体功耗,使唤醒关键词检测的功耗与性能均得到有效保证。

35、进一步地,对采集的声音数据进行语音活动检测,定向缓存声音数据,避免存储不必要的噪声数据,降低功耗;在检测到可能为语音后,再唤醒子处理平台,可以进一步降低功耗。

36、进一步地,针对不同麦克风类型,设计多种不同的低功耗采集方式,而且可以向低功耗语音活动检测模块提供多种不同来源的声音数据,方便用户选择实际使用的声音采集设备,方便灵活地满足不同用户的应用需求。

37、进一步地,将语音活动检测的分为两级,即前级语音活动检测和后级语音活动检测,前级语音活动检测负责检测是否可能为语音,排除部分噪声,降低功耗;此外,前级语音活动检测的输入数据并不直接使用采集模块采集的声音数据,而是使用对其进行数据处理后得到的便于语音检测的数据。也就是说,前级语音活动检测的作用不仅决定是否触发后级语音活动检测,还影响数据存储单元的缓存条件,并且后级语音活动检测在被触发后不是从数据存储单元中读取其输入数据,而是直接来自于前级vad的输出。根据语音活动检测结果缓存语音数据,可以减少不必要的数据缓存,降低数据缓存的功耗。


技术特征:

1.一种低功耗语音唤醒系统,其特征在于,所述系统包括:子处理平台、以及主处理平台;

2.根据权利要求1所述的系统,其特征在于,

3.根据权利要求1所述的系统,其特征在于,

4.根据权利要求1所述的系统,其特征在于,

5.根据权利要求1至4任一项所述的系统,其特征在于,所述系统还包括:低功耗信号采集模块、以及低功耗语音活动检测模块;

6.根据权利要求5所述的系统,其特征在于,所述低功耗信号采集模块包括:数字麦克风、和/或模拟麦克风,用于为所述低功耗语音活动检测模块提供多种不同来源的声音数据。

7.根据权利要求5所述的系统,其特征在于,所述低功耗语音活动检测模块位于所述低功耗语音唤醒系统中为低功耗设计的专用数字区域。

8.根据权利要求6所述的系统,其特征在于,所述低功耗语音活动检测模块包括:数字接口、数字滤波单元、硬化语音活动检测单元、以及数据存储单元;

9.根据权利要求8所述的系统,其特征在于,所述硬化语音活动检测单元包括:前级语音活动检测单元和后级语音活动检测单元;

10.根据权利要求9所述的系统,其特征在于,所述前级语音活动检测单元的性能和复杂度均低于后级语音活动检测单元的性能和复杂度。

11.根据权利要求5所述的系统,其特征在于,所述低功耗语音活动检测模块、所述子处理平台、以及所述主处理平台的工作采样率相同或者不同。

12.一种低功耗语音唤醒方法,其特征在于,所述方法基于子处理平台和主处理平台进行两级唤醒关键词检测;所述方法包括:

13.根据权利要求12所述的方法,其特征在于,所述方法还包括:

14.根据权利要求12所述的方法,其特征在于,所述方法还包括:

15.根据权利要求12至14任一项所述的方法,其特征在于,所述方法还包括:

16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求12至15任一项所述方法的步骤。

17.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行权利要求12至15任一项所述方法的步骤。


技术总结
本发明公开了一种低功耗语音唤醒系统及方法、电子设备,该系统包括:子处理平台、以及主处理平台;子处理平台用于对语音数据进行前级关键词检测,并在检测到可能包含唤醒关键词时,对语音数据进行缓存,并唤醒主处理平台;主处理平台用于在唤醒后执行后级关键词检测,确定子处理平台缓存的语音数据是否包含唤醒关键词。利用本发明方案,可以在保证唤醒关键词识别准确性的同时大大降低系统功耗。

技术研发人员:许方铖,叶顺舟,唐旭,吕达文
受保护的技术使用者:展讯通信(上海)有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-19937.html

最新回复(0)