本发明属于环境噪声监测,具体涉及一种基于自注意力机制的环境噪声监测方法。
背景技术:
1、现有的环境噪声监测方法大多依赖于传统的声学传感器和信号处理算法,这些方法在复杂环境中容易受到背景噪声、时频变化不稳定等多重因素的影响,导致监测结果不够准确。同时,随着城市化进程的加快,环境噪声源日益复杂多样,对噪声监测的实时性和准确性提出了更高的要求,因而提出一种基于自注意力机制的环境噪声监测方法,用以解决上述问题。
技术实现思路
1、本发明的目的在于提供一种基于自注意力机制的环境噪声监测方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于自注意力机制的环境噪声监测方法,包括如下步骤:
3、s1:通过短时傅里叶变换将音频信号转换为频谱图;
4、s2:通过自注意力机制提取频谱图的声纹特征;
5、s3:通过神经网络声纹特征对应到具体的环境声源类别。
6、优选地,所述的通过短时傅里叶变换将音频信号转换为频谱图步骤具体包括:
7、s11:通过传声器将环境声信号转换为电信号;
8、s12:通过采集器将连续的电信号采样为离散时间序列信号;
9、s13:通过滑动时间窗口将离散时间序列信号切片为相邻之间存在时域重叠的信号向量。
10、s14:对每一个信号向量做离散时间傅里叶变换且只保留幅值结果,按照时间顺序对变换结果沿着行方向进行堆叠,得到频谱图矩阵。
11、优选地,所述的通过自注意力机制提取频谱图的声纹特征步骤具体包括:
12、s21:将s14中所述的频谱图矩阵切片,得到n个相互之间有重叠的子矩阵,尺寸为;
13、s22:将所述n个相互之间有重叠的子矩阵通过线性变换重塑为向量,并额外增加可训练的类别特征,即;
14、s23:将位置信息融入特征向量中,所述所有特征向量和附带可训练参数的位置信息向量相加,得到特征向量,;
15、s24:将输入到基于自注意力的编码器中提取声纹特征。
16、优选地,所述的将输入到基于自注意力的编码器中提取声纹特征步骤具体包括:
17、s241:将特征向量输入至第一个残差块,该残差块的残差部分包括一个正则化层和一个多头注意力机制层;
18、s242:第一个残差块的输出输入至第一个残差块,该残差块的残差部分包括一个正则化层和一个多层感知机层;
19、s243:将s241~s242重复l次,每次重复的输入为上一次重复的输出结果。
20、优选地,所述的将特征向量输入至第一个残差块,该残差块的残差部分包括一个正则化层和一个多头注意力机制层步骤具体包括:
21、s2411:使用三个不同的带有可训练参数的线性变换矩阵与输入矩阵相乘,得到三个不同的结果分别为query(q),keys(k),values(v);
22、s2412:将query和keys进行矩阵点乘,除以矩阵的列尺寸的平方根,最后使用预设函数进行归一化处理;
23、s2413:将values和s2412的输出结果进行矩阵点乘;
24、s2414:将s2411~s2413并行重复h次,将并行输出的h个矩阵按照列方向进行拼接,最后进行线性变化。
25、优选地,所述信号向量为列向量。
26、优选地,所述s2412中,所述预设函数为归一化指数函数。
27、与现有技术相比,本发明的有益效果是:
28、本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。这种机制使得模型在复杂环境声背景下仍能准确识别出各种声源类别,如交通噪声、工业噪声、生活噪声等,显著提高了分类的精度和识别能力。
1.一种基于自注意力机制的环境噪声监测方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的一种基于自注意力机制的环境噪声监测方法,其特征在于:所述的通过短时傅里叶变换将音频信号转换为频谱图步骤具体包括:
3.根据权利要求2所述的一种基于自注意力机制的环境噪声监测方法,其特征在于:所述的通过自注意力机制提取频谱图的声纹特征步骤具体包括:
4.根据权利要求3所述的一种基于自注意力机制的环境噪声监测方法,其特征在于:所述s24具体包括:
5.根据权利要求4所述的一种基于自注意力机制的环境噪声监测方法,其特征在于:所述s241具体包括:
6.根据权利要求5所述的一种基于自注意力机制的环境噪声监测方法,其特征在于:所述信号向量为列向量。
7.根据权利要求6所述的一种基于自注意力机制的环境噪声监测方法,其特征在于:所述s2412中,所述预设函数为归一化指数函数。