本技术涉及声纹定位,尤其涉及一种doa估计关联的多声源定位方法、系统、设备及介质。
背景技术:
1、在声源定位技术方案中,节点可由单个传声器或传声器阵列(即按预定几何形状排列的多个传声器)组成,并分布在监测区域的不同位置。目前多数方法利用多声纹采集节点接收到的信息并将这些信息与相关声源的位置联系起来,如能量、时间、方向特征以及空间似然函数等。然而,声纹传感器网络本身具有如节点有限的数据处理能力,以及可能的实时处理要求的限制因素,节点无法执行非常复杂的计算密集型操作,而带宽使用的限制也限制了网络中可传输的信息量。同时由于节点是单独运行的,不同节点所需的声纹信号无法同步。
2、以上问题,现有技术通常通过以下方法解决:每个节点估算并传输有效声源的到达方向角(doa,direction of arrival)估计值,doa估计值描述了声音在每个时间瞬间相对于节点的传播方向。声源的位置可以通过融合doa测量值(也称作声纳测量值)在融合中心估算出来,例如music和esprit算法。虽然这类方法需要增加节点的计算复杂度来执行doa估算,但由于只需传输doa估算值,因此带宽使用率较低。此外,由于doa估计在每个节点单独进行,因此不同节点的音频信号无需完全同步。
3、然而上述常用的方法往往忽略了一个基本问题:在具有多个声源存在时,从每个节点接收到多个doa估计值(每个检测到的声源一个doa),我们无法知道每个doa属于哪个声源。这就是所谓的数据关联问题。图1为本发明所解决的多源定位doa错误匹配的问题示意图,如图1所示,必须找到对应于同一声源的节点的doa的正确关联,否则位置估计将导致“假象”声源,即与真实声源不对应的位置进而导致错误的定位结果。此外,当多个声源处于移动状态时,一些节点可能无法检测到某些声源的声纹信息导致漏检现象,检测到的声纹数量也就是单个节点估计出的doa数量会因节点位置和时间的不同而变化,漏检问题在实践中经常出现。
4、因此对于多声源数据的多节点的doa关联和信息传输性能的提升是当前技术方法和方案中需要改善的重点。
技术实现思路
1、本技术实施例提供了一种doa估计关联的多声源定位方法、系统、设备及介质,解决在多个声源下现有的声源定位技术容易产生“假象”声源导致错误的定位结果、带宽使用的限制也制约了网络中可传输的信息量的技术问题。
2、第一方面,本技术实施例提供了一种低比特率策略和doa估计关联的多声源定位方法,包括:构建声纹定位节点网络,并在节点网络中选取一节点作为中央节点;其中,节点设置有信号处理单元和无线通信单元;节点捕获到声纹信号后,通过信号处理单元计算得到声纹信号的若干个doa,并通过预设方法计算得到声纹信号中的频率成分归属于各doa的频率直方图,将doa对应的频率直方图作为节点的频率特征集合,进行低比特率压缩处理后通过无线通信单元传输到中央节点;中央节点通过基于特征相似性的贪婪算法,对接收到的频率特征集合进行关联处理,将属于同一声源的doa进行聚合得到doa集合后,根据doa集合计算得到若干个声源的位置。
3、进一步地,构建声纹定位节点网络,具体包括:将若干个麦克风作为节点,根据预设的几何结构排列,组成声纹定位节点网络,并将几何结构左上角的第一个节点作为中央节点。
4、进一步地,通过预设方法计算得到声纹信号中的频率成分归属于各doa的频率直方图,具体包括:将在一个时刻获得的声纹信号根据stft变换算法计算得到声纹信号的表达式;其中,p为节点索引,τ为时刻索引,为声纹信号的频率成分索引;通过宽带doa角度估计方法,根据频率成分计算声纹信号对应若干个声源的若干个doa,并形成doa集合;其中,k为doa的数量;通过窄带doa角度估计方法,计算一个时刻中一个节点的频率成分属于各个doa的概率,并将频率成分分配给概率最大的doa;将预设时间长度内分配给一个doa的各频率成分的次数分别累加,得到doa的频率直方图,并将一个节点的所有频率直方图定义为一个该节点的频率特征集合;其中,频率直方图的纵坐标为分配次数累加和,横坐标为分配给该doa的频率成分;频率特征集合包含对应k个doa的k个频率直方图。
5、进一步地,进行低比特率压缩处理后通过无线通信单元传输到中央节点,压缩处理的方法为:通过公式对频率直方图进行压缩处理;其中,和分别为压缩前的频率直方图与压缩后的频率直方图,d为预设的压缩因子,b为频率成分的分配次数累加和。
6、进一步地,将属于同一声源的doa进行聚合得到doa集合后,根据doa集合计算得到若干个声源的位置,具体包括:中央节点接收n个节点的频率特征集合,即n*k个频率直方图,并依次遍历n个节点,计算当前节点频率特征集合中频率直方图与下一个节点中的各频率直方图的ssim值,找到ssim值最大的频率直方图,并将与频率直方图相关联;其中,p和q为节点的序号,b为p节点上的第b个频率直方图,v为q节点上的第v个频率直方图;根据上述过程依次遍历n个节点上的k个频率特征直方图后,任意一个节点上的频率直方图都与下一个节点上的某个频率直方图唯一关联,将相互关联的频率直方图组合,得到对应k个声源的k个doa集合,并记录集合中最大的ssim值;其中i为该集合中来自于第一个节点的频率直方图的序号;依次计算doa集合各频率直方图与其他集合的所有频率直方图的ssim值,即计算集合的一个频率直方图与其余集合中的各频率直方图的ssim值,若计算的ssim值大于记录的最大ssim值,则将该ssim值对应的频率直方图替换集合中与其属于同一节点的频率直方图交换,得到交换后的doa集合;根据交换后的k个doa集合内的所有频率直方图确定各声源对应于不同节点的doa,通过声源定位算法得到对应的k个声源位置。
7、进一步地,的计算公式为
8、
9、其中,和分别为频率直方图b和频率直方图v的像素亮度的均值,和分别为频率直方图b和频率直方图v的像素亮度的方差,反映图像的对比度,为频率直方图b和频率直方图v的协方差,表示两幅图像亮度变化的相关性,和为预设的稳定系数。
10、第二方面,本技术实施例还提供了一种doa估计关联的多声源定位系统,包括:网络构建模块,构建声纹定位节点网络,并在节点网络中选取一节点作为中央节点;其中,节点设置有信号处理单元和无线通信单元;doa计算模块,节点捕获到声纹信号后,通过信号处理单元计算得到声纹信号的若干个doa,并通过预设方法计算得到声纹信号中的频率成分归属于各doa的频率直方图,将doa对应的频率直方图作为节点的频率特征集合,进行低比特率压缩处理后通过无线通信单元传输到中央节点;聚合处理模块,中央节点通过基于特征相似性的贪婪算法,对接收到的频率特征集合进行关联处理,将属于同一声源的doa进行聚合得到doa集合后,根据doa集合计算得到若干个声源的位置。
11、第三方面,本技术实施例还提供了一种doa估计关联的多声源定位设备,设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:实现上述一种doa估计关联的多声源定位方法的任意一项步骤。
12、第四方面,本技术实施例还提供了一种doa估计关联的多声源定位非易失性计算机存储介质,存储有计算机可执行的指令,计算机可执行指令设置为:能够实现上述一种doa估计关联的多声源定位方法的任意一项步骤。
13、本技术实施例提供的一种低比特率策略和doa估计关联的多声源定位方法及系统,通过特征相似性的贪婪算法对多个节点的数据进行关联处理,能够更有效地区分真实声源与干扰信号,从而显著减少“假象”声源的产生,提高定位的准确性;并通过低比特率压缩处理频率特征集合,极大地减少了数据传输所需的带宽;本技术实施例在降低了对带宽的使用要求的同时提升了定位精度,解决了存在多个声源时现有的声源定位技术容易产生“假象”声源导致错误的定位结果、带宽使用的限制也制约了网络中可传输的信息量的技术问题。
1.一种doa估计关联的多声源定位方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种doa估计关联的多声源定位方法,其特征在于,构建声纹定位节点网络,具体包括:
3.根据权利要求1所述的一种doa估计关联的多声源定位方法,其特征在于,通过预设方法计算得到所述声纹信号中的频率成分归属于所述各doa的频率直方图,具体包括:
4.根据权利要求1或权利要求3所述的一种doa估计关联的多声源定位方法,其特征在于,进行低比特率压缩处理后通过无线通信单元传输到中央节点,所述压缩处理的方法为:
5.根据权利要求1或权利要求3所述的一种doa估计关联的多声源定位方法,其特征在于,将属于同一声源的doa进行聚合得到doa集合后,根据doa集合计算得到若干个声源的位置,具体包括:
6.根据权利要求5所述的一种doa估计关联的多声源定位方法,其特征在于,所述的计算公式为
7.一种doa估计关联的多声源定位系统,其特征在于,包括:
8.一种doa估计关联的多声源定位设备,其特征在于,所述设备包括:
9.一种doa估计关联的多声源定位的非易失性计算机存储介质,存储有计算机可执行的指令,其特征在于,所述计算机可执行指令设置为:能够实现权利要求1-6任意一项所述方法的步骤。
